cs.CL」カテゴリーアーカイブ

DualToken: Towards Unifying Visual Understanding and Generation with Dual Visual Vocabularies

要約 視覚的理解と生成に必要な異なる表現スペースは、大規模な言語モデルの自己回帰 … 続きを読む

カテゴリー: cs.CL, cs.CV | DualToken: Towards Unifying Visual Understanding and Generation with Dual Visual Vocabularies はコメントを受け付けていません

MoonCast: High-Quality Zero-Shot Podcast Generation

要約 テキスト間合成の最近の進歩は、個々のスピーカーの高品質の短い発言を生み出す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | MoonCast: High-Quality Zero-Shot Podcast Generation はコメントを受け付けていません

AdaST: Dynamically Adapting Encoder States in the Decoder for End-to-End Speech-to-Text Translation

要約 エンドツーエンドの音声翻訳では、エンコーダーによって学んだ音響表現は、通常 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | AdaST: Dynamically Adapting Encoder States in the Decoder for End-to-End Speech-to-Text Translation はコメントを受け付けていません

Towards Harmless Multimodal Assistants with Blind Preference Optimization

要約 マルチモーダル大手言語モデル(MLLM)は、マルチモーダルの理解、推論、お … 続きを読む

カテゴリー: cs.CL, cs.CV | Towards Harmless Multimodal Assistants with Blind Preference Optimization はコメントを受け付けていません

Implicit Reasoning in Transformers is Reasoning through Shortcuts

要約 OpenaiのO1とO3の成功とDeepseekのR1の成功によって示され … 続きを読む

カテゴリー: cs.CL | Implicit Reasoning in Transformers is Reasoning through Shortcuts はコメントを受け付けていません

Benchmarking Failures in Tool-Augmented Language Models

要約 ツールの統合により、バニラテキスト生成を超えて言語モデル(LMS)の機能が … 続きを読む

カテゴリー: cs.CL, cs.SE | Benchmarking Failures in Tool-Augmented Language Models はコメントを受け付けていません

Unlocking State-Tracking in Linear RNNs Through Negative Eigenvalues

要約 Mamba、RWKV、GLA、MLSTM、Deltanetなどの線形再発性 … 続きを読む

カテゴリー: cs.CL, cs.FL, cs.LG | Unlocking State-Tracking in Linear RNNs Through Negative Eigenvalues はコメントを受け付けていません

Zero-Shot Action Recognition in Surveillance Videos

要約 公共スペースでの監視に対する需要の高まりは、人的資源の不足により大きな課題 … 続きを読む

カテゴリー: cs.CL, cs.CV | Zero-Shot Action Recognition in Surveillance Videos はコメントを受け付けていません

JuDGE: Benchmarking Judgment Document Generation for Chinese Legal System

要約 このペーパーでは、中国の法制度における判断文書生成のパフォーマンスを評価す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | JuDGE: Benchmarking Judgment Document Generation for Chinese Legal System はコメントを受け付けていません

The Problem of Coherence in Natural Language Explanations of Recommendations

要約 推奨事項に自然言語の説明を提供することは、非専門家ユーザーの観点から特に役 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | The Problem of Coherence in Natural Language Explanations of Recommendations はコメントを受け付けていません