cs.AI」カテゴリーアーカイブ

Vision language models are unreliable at trivial spatial cognition

要約 ビジョン言語モデル(VLM)は、画像から関連する視覚空間情報を抽出するよう … 続きを読む

カテゴリー: cs.AI, cs.CV | Vision language models are unreliable at trivial spatial cognition はコメントを受け付けていません

Describe Anything: Detailed Localized Image and Video Captioning

要約 画像やビデオで特定の領域の詳細かつ正確な説明を生成することは、ビジョン言語 … 続きを読む

カテゴリー: cs.AI, cs.CV | Describe Anything: Detailed Localized Image and Video Captioning はコメントを受け付けていません

Learning to Reason under Off-Policy Guidance

要約 大規模な推論モデル(LRMS)の最近の進歩は、マルチステップ推論や自己反省 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Learning to Reason under Off-Policy Guidance はコメントを受け付けていません

Understanding LLM Behaviors via Compression: Data Generation, Knowledge Acquisition and Scaling Laws

要約 大規模な言語モデル(LLMS)は、多数のタスクにわたって顕著な能力を実証し … 続きを読む

カテゴリー: cs.AI, cs.IT, cs.LG, math.IT | Understanding LLM Behaviors via Compression: Data Generation, Knowledge Acquisition and Scaling Laws はコメントを受け付けていません

Distribution-aware Forgetting Compensation for Exemplar-Free Lifelong Person Re-identification

要約 生涯にわたる人の再識別(LREID)は、新しい情報に適応しながら古い知識を … 続きを読む

カテゴリー: cs.AI, cs.CV | Distribution-aware Forgetting Compensation for Exemplar-Free Lifelong Person Re-identification はコメントを受け付けていません

Synergistic Weak-Strong Collaboration by Aligning Preferences

要約 現在の大規模な言語モデル(LLM)は、一般的な推論で優れていますが、独自ま … 続きを読む

カテゴリー: cs.AI | Synergistic Weak-Strong Collaboration by Aligning Preferences はコメントを受け付けていません

From Imitation to Exploration: End-to-end Autonomous Driving based on World Model

要約 近年、エンドツーエンドの自律運転アーキテクチャは、エラーの蓄積を回避する際 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | From Imitation to Exploration: End-to-end Autonomous Driving based on World Model はコメントを受け付けていません

LLM-Enabled In-Context Learning for Data Collection Scheduling in UAV-assisted Sensor Networks

要約 無人航空機(UAV)は、さまざまなプライベートおよび商業用アプリケーション … 続きを読む

カテゴリー: 53-01, C.2, cs.AI, cs.ET, cs.LG, cs.RO | LLM-Enabled In-Context Learning for Data Collection Scheduling in UAV-assisted Sensor Networks はコメントを受け付けていません

Modality Selection and Skill Segmentation via Cross-Modality Attention

要約 触覚やオーディオなどの追加の感覚モダリティを基礎ロボットモデルに組み込むこ … 続きを読む

カテゴリー: cs.AI, cs.RO | Modality Selection and Skill Segmentation via Cross-Modality Attention はコメントを受け付けていません

Phoenix: A Motion-based Self-Reflection Framework for Fine-grained Robotic Action Correction

要約 一般化可能な自己修正システムの構築は、ロボットが障害から回復するために重要 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Phoenix: A Motion-based Self-Reflection Framework for Fine-grained Robotic Action Correction はコメントを受け付けていません