月別アーカイブ: 2025年4月

SQuat: Subspace-orthogonal KV Cache Quantization

要約 キー価値(KV)キャッシュは、以前に生成されたトークンからKVテンソルを保 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IT, cs.LG, math.IT | SQuat: Subspace-orthogonal KV Cache Quantization はコメントを受け付けていません

Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation

要約 大規模な現実世界のロボットデータセットは、ジェネラリストのロボットモデルを … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation はコメントを受け付けていません

Which LIME should I trust? Concepts, Challenges, and Solutions

要約 ニューラルネットワークが必須システムで支配的になるにつれて、説明可能な人工 … 続きを読む

カテゴリー: cs.AI, cs.LG | Which LIME should I trust? Concepts, Challenges, and Solutions はコメントを受け付けていません

Effectively Controlling Reasoning Models through Thinking Intervention

要約 推論強化された大手言語モデル(LLMS)は、最終回答を生成する前に中間推論 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Effectively Controlling Reasoning Models through Thinking Intervention はコメントを受け付けていません

Harnessing the Reasoning Economy: A Survey of Efficient Reasoning for Large Language Models

要約 大規模な言語モデル(LLMS)の最近の進歩により、複雑な推論タスクを実行す … 続きを読む

カテゴリー: cs.AI, cs.CL | Harnessing the Reasoning Economy: A Survey of Efficient Reasoning for Large Language Models はコメントを受け付けていません

ACPBench Hard: Unrestrained Reasoning about Action, Change, and Planning

要約 ACPBenchデータセットは、効率的な計画に必要な原子推論タスクを提供し … 続きを読む

カテゴリー: cs.AI | ACPBench Hard: Unrestrained Reasoning about Action, Change, and Planning はコメントを受け付けていません

RIG: Synergizing Reasoning and Imagination in End-to-End Generalist Policy

要約 アクションの前に推論し、潜在的な結果(つまり、世界モデル)を想像することは … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | RIG: Synergizing Reasoning and Imagination in End-to-End Generalist Policy はコメントを受け付けていません

COSMO: Combination of Selective Memorization for Low-cost Vision-and-Language Navigation

要約 ビジョンと言語のナビゲーション(VLN)タスクは、ホームアシスタントのよう … 続きを読む

カテゴリー: cs.CV, cs.RO | COSMO: Combination of Selective Memorization for Low-cost Vision-and-Language Navigation はコメントを受け付けていません

From Colors to Classes: Emergence of Concepts in Vision Transformers

要約 ビジョントランス(VITS)は、強力な表現能力により、さまざまなコンピュー … 続きを読む

カテゴリー: cs.CV, cs.LG | From Colors to Classes: Emergence of Concepts in Vision Transformers はコメントを受け付けていません

MoMuSE: Momentum Multi-modal Target Speaker Extraction for Real-time Scenarios with Impaired Visual Cues

要約 オーディオビジュアルターゲットスピーカー抽出(AV-TSE)は、時間同期さ … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | MoMuSE: Momentum Multi-modal Target Speaker Extraction for Real-time Scenarios with Impaired Visual Cues はコメントを受け付けていません