月別アーカイブ: 2025年3月

LION-FS: Fast & Slow Video-Language Thinker as Online Video Assistant

要約 一人称ビデオアシスタントは、オンラインビデオの対話を通じて私たちの日常生活 … 続きを読む

カテゴリー: cs.CV | LION-FS: Fast & Slow Video-Language Thinker as Online Video Assistant はコメントを受け付けていません

Chunking the Critic: A Transformer-based Soft Actor-Critic with N-Step Returns

要約 Soft Actor-Critic(SAC)は、批評家ネットワークに大きく … 続きを読む

カテゴリー: cs.LG | Chunking the Critic: A Transformer-based Soft Actor-Critic with N-Step Returns はコメントを受け付けていません

Decoupled Recommender Systems: Exploring Alternative Recommender Ecosystem Designs

要約 推奨エコシステムは、研究の新たな主題です。 このような研究では、アルゴリズ … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.IR | Decoupled Recommender Systems: Exploring Alternative Recommender Ecosystem Designs はコメントを受け付けていません

DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms

要約 Dongbaの絵文字は、世界でまだ使用されている唯一の絵文字です。 それら … 続きを読む

カテゴリー: cs.CV | DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms はコメントを受け付けていません

Joint-repositionable Inner-wireless Planar Snake Robot

要約 バイオ風のマルチジョイントヘビロボットは、手足の構造と柔軟性が高いため、地 … 続きを読む

カテゴリー: cs.RO, cs.SY, eess.SY | Joint-repositionable Inner-wireless Planar Snake Robot はコメントを受け付けていません

TeraSim: Uncovering Unknown Unsafe Events for Autonomous Vehicles through Generative Simulation

要約 交通シミュレーションは、自動運転車(AV)開発に不可欠であり、多様な運転条 … 続きを読む

カテゴリー: cs.RO, cs.SY, eess.SY | TeraSim: Uncovering Unknown Unsafe Events for Autonomous Vehicles through Generative Simulation はコメントを受け付けていません

Unified Mind Model: Reimagining Autonomous Agents in the LLM Era

要約 大規模な言語モデル(LLM)は最近、ドメイン、タスク、言語(ChatGPT … 続きを読む

カテゴリー: cs.AI, cs.CL | Unified Mind Model: Reimagining Autonomous Agents in the LLM Era はコメントを受け付けていません

SMAC-R1: The Emergence of Intelligence in Decision-Making Tasks

要約 Starcraft Multi-Agent Challenge(SMAC) … 続きを読む

カテゴリー: cs.AI | SMAC-R1: The Emergence of Intelligence in Decision-Making Tasks はコメントを受け付けていません

Towards Visual Discrimination and Reasoning of Real-World Physical Dynamics: Physics-Grounded Anomaly Detection

要約 人間は、オブジェクトが条件付けられた物理的知識に基づいて知覚、相互作用、お … 続きを読む

カテゴリー: cs.AI, cs.CV | Towards Visual Discrimination and Reasoning of Real-World Physical Dynamics: Physics-Grounded Anomaly Detection はコメントを受け付けていません

Reasoning to Attend: Try to Understand How Token Works

要約 現在の大規模なマルチモーダルモデル(LMMS)は、視覚言語モデル(LLAV … 続きを読む

カテゴリー: cs.CV | Reasoning to Attend: Try to Understand How Token Works はコメントを受け付けていません