月別アーカイブ: 2025年4月

SQuat: Subspace-orthogonal KV Cache Quantization

投稿日: 2025年4月1日作成者: jarxiv

要約キー価値（KV）キャッシュは、以前に生成されたトークンからKVテンソルを保 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IT, cs.LG, math.IT | コメントを受け付けていません

Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation

投稿日: 2025年4月1日作成者: jarxiv

要約大規模な現実世界のロボットデータセットは、ジェネラリストのロボットモデルを … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Which LIME should I trust? Concepts, Challenges, and Solutions

投稿日: 2025年4月1日作成者: jarxiv

要約ニューラルネットワークが必須システムで支配的になるにつれて、説明可能な人工 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Effectively Controlling Reasoning Models through Thinking Intervention

投稿日: 2025年4月1日作成者: jarxiv

要約推論強化された大手言語モデル（LLMS）は、最終回答を生成する前に中間推論 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Harnessing the Reasoning Economy: A Survey of Efficient Reasoning for Large Language Models

投稿日: 2025年4月1日作成者: jarxiv

要約大規模な言語モデル（LLMS）の最近の進歩により、複雑な推論タスクを実行す … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

ACPBench Hard: Unrestrained Reasoning about Action, Change, and Planning

投稿日: 2025年4月1日作成者: jarxiv

要約 ACPBenchデータセットは、効率的な計画に必要な原子推論タスクを提供し … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

RIG: Synergizing Reasoning and Imagination in End-to-End Generalist Policy

投稿日: 2025年4月1日作成者: jarxiv

要約アクションの前に推論し、潜在的な結果（つまり、世界モデル）を想像することは … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

COSMO: Combination of Selective Memorization for Low-cost Vision-and-Language Navigation

投稿日: 2025年4月1日作成者: jarxiv

要約ビジョンと言語のナビゲーション（VLN）タスクは、ホームアシスタントのよう … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

From Colors to Classes: Emergence of Concepts in Vision Transformers

投稿日: 2025年4月1日作成者: jarxiv

要約ビジョントランス（VITS）は、強力な表現能力により、さまざまなコンピュー … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

MoMuSE: Momentum Multi-modal Target Speaker Extraction for Real-time Scenarios with Impaired Visual Cues

投稿日: 2025年4月1日作成者: jarxiv

要約オーディオビジュアルターゲットスピーカー抽出（AV-TSE）は、時間同期さ … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

月別アーカイブ: 2025年4月

SQuat: Subspace-orthogonal KV Cache Quantization

Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation

Which LIME should I trust? Concepts, Challenges, and Solutions

Effectively Controlling Reasoning Models through Thinking Intervention

Harnessing the Reasoning Economy: A Survey of Efficient Reasoning for Large Language Models

ACPBench Hard: Unrestrained Reasoning about Action, Change, and Planning

RIG: Synergizing Reasoning and Imagination in End-to-End Generalist Policy

COSMO: Combination of Selective Memorization for Low-cost Vision-and-Language Navigation

From Colors to Classes: Emergence of Concepts in Vision Transformers

MoMuSE: Momentum Multi-modal Target Speaker Extraction for Real-time Scenarios with Impaired Visual Cues

最近の投稿

最近のコメント

アーカイブ

カテゴリー