cs.AI」カテゴリーアーカイブ

Exploring Speaker Diarization with Mixture of Experts

要約 このホワイトペーパーでは、メモリ対応のマルチスピーカー埋め込みを使用して、 … 続きを読む

カテゴリー: cs.AI, cs.SD | Exploring Speaker Diarization with Mixture of Experts はコメントを受け付けていません

Optimizing Length Compression in Large Reasoning Models

要約 大規模な推論モデル(LRM)は驚くべき成功を収めていますが、しばしば不必要 … 続きを読む

カテゴリー: cs.AI, cs.CL | Optimizing Length Compression in Large Reasoning Models はコメントを受け付けていません

SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints

要約 言語エージェントが重要なタスクをますます自動化するにつれて、ドメイン固有の … 続きを読む

カテゴリー: cs.AI, cs.CL | SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints はコメントを受け付けていません

Controllable and Reliable Knowledge-Intensive Task-Oriented Conversational Agents with Declarative Genie Worksheets

要約 大規模な言語モデルは、タスクと知識のユーザー要求に応答して、さまざまな設定 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.PL | Controllable and Reliable Knowledge-Intensive Task-Oriented Conversational Agents with Declarative Genie Worksheets はコメントを受け付けていません

From Bytes to Ideas: Language Modeling with Autoregressive U-Nets

要約 トークン化は、入力テキストに固定された粒度を課し、言語モデルがデータでどの … 続きを読む

カテゴリー: cs.AI, cs.CL | From Bytes to Ideas: Language Modeling with Autoregressive U-Nets はコメントを受け付けていません

A Variational Framework for Improving Naturalness in Generative Spoken Language Models

要約 テキスト処理における大規模な言語モデルの成功により、音声モデリングへの適応 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | A Variational Framework for Improving Naturalness in Generative Spoken Language Models はコメントを受け付けていません

Chain-of-Thought Reasoning In The Wild Is Not Always Faithful

要約 チェーンオブシャーチ(COT)の推論は、最先端のAI機能を大幅に進めていま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Chain-of-Thought Reasoning In The Wild Is Not Always Faithful はコメントを受け付けていません

FlowAlign: Trajectory-Regularized, Inversion-Free Flow-based Image Editing

要約 Floweditなどのフローベースの画像編集方法は、安定した拡散3などの事 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | FlowAlign: Trajectory-Regularized, Inversion-Free Flow-based Image Editing はコメントを受け付けていません

PunchBench: Benchmarking MLLMs in Multimodal Punchline Comprehension

要約 画像キャプションペアで伝えられるユーモアや皮肉を含むマルチモーダルパンチラ … 続きを読む

カテゴリー: cs.AI, cs.CV | PunchBench: Benchmarking MLLMs in Multimodal Punchline Comprehension はコメントを受け付けていません

GAMORA: A Gesture Articulated Meta Operative Robotic Arm for Hazardous Material Handling in Containment-Level Environments

要約 ロボット工学と仮想現実(VR)の収束により、高リスクの実験室の設定、特にウ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | GAMORA: A Gesture Articulated Meta Operative Robotic Arm for Hazardous Material Handling in Containment-Level Environments はコメントを受け付けていません