cs.AI」カテゴリーアーカイブ

Learning Abstract Visual Reasoning via Task Decomposition: A Case Study in Raven Progressive Matrices

要約 抽象的な推論の実行を学習するには、多くの場合、問題のタスクを中間のサブ目標 … 続きを読む

カテゴリー: 68T05, cs.AI, cs.CV, cs.LG, I.2.10 | Learning Abstract Visual Reasoning via Task Decomposition: A Case Study in Raven Progressive Matrices はコメントを受け付けていません

VeCLIP: Improving CLIP Training via Visual-enriched Captions

要約 Web クロールされた大規模なデータセットは、CLIP などの視覚言語モデ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | VeCLIP: Improving CLIP Training via Visual-enriched Captions はコメントを受け付けていません

How Far Are We from Intelligent Visual Deductive Reasoning?

要約 GPT-4V などの視覚言語モデル (VLM) は、最近、多様な視覚言語タ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | How Far Are We from Intelligent Visual Deductive Reasoning? はコメントを受け付けていません

Q&A Prompts: Discovering Rich Visual Clues through Mining Question-Answer Prompts for VQA requiring Diverse World Knowledge

要約 マルチモーダルな大規模言語モデルの画期的な進歩により、高度な推論能力と世界 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Q&A Prompts: Discovering Rich Visual Clues through Mining Question-Answer Prompts for VQA requiring Diverse World Knowledge はコメントを受け付けていません

RACE-SM: Reinforcement Learning Based Autonomous Control for Social On-Ramp Merging

要約 人間が制御する交通における自律並列スタイルの入口ランプ合流は、引き続き自律 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | RACE-SM: Reinforcement Learning Based Autonomous Control for Social On-Ramp Merging はコメントを受け付けていません

SceneVerse: Scaling 3D Vision-Language Learning for Grounded Scene Understanding

要約 言語を 3D 物理環境に合わせることに焦点を当てた 3D 視覚と言語の基礎 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | SceneVerse: Scaling 3D Vision-Language Learning for Grounded Scene Understanding はコメントを受け付けていません

Continual Driving Policy Optimization with Closed-Loop Individualized Curricula

要約 自動運転車 (AV) の安全性は長年にわたる最大の懸案事項であり、これはロ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Continual Driving Policy Optimization with Closed-Loop Individualized Curricula はコメントを受け付けていません

Prompt Mining for Language-based Human Mobility Forecasting

要約 大規模な言語モデルの進歩により、言語ベースの予測が人間の移動パターンを予測 … 続きを読む

カテゴリー: cs.AI, cs.CL | Prompt Mining for Language-based Human Mobility Forecasting はコメントを受け付けていません

gaHealth: An English-Irish Bilingual Corpus of Health Data

要約 機械翻訳は、多くの高リソース言語ペアにとって成熟したテクノロジーです。 た … 続きを読む

カテゴリー: cs.AI, cs.CL | gaHealth: An English-Irish Bilingual Corpus of Health Data はコメントを受け付けていません

Arithmetic with Language Models: from Memorization to Computation

要約 最近の大規模な言語モデルの新たな計算能力と問題解決能力をより深く理解するこ … 続きを読む

カテゴリー: cs.AI, cs.CL | Arithmetic with Language Models: from Memorization to Computation はコメントを受け付けていません