「cs.AI」カテゴリーアーカイブ

Learning Abstract Visual Reasoning via Task Decomposition: A Case Study in Raven Progressive Matrices

投稿日: 2024年3月8日作成者: jarxiv

要約抽象的な推論の実行を学習するには、多くの場合、問題のタスクを中間のサブ目標 … 続きを読む →

カテゴリー: 68T05, cs.AI, cs.CV, cs.LG, I.2.10 | コメントを受け付けていません

VeCLIP: Improving CLIP Training via Visual-enriched Captions

投稿日: 2024年3月8日作成者: jarxiv

要約 Web クロールされた大規模なデータセットは、CLIP などの視覚言語モデ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

How Far Are We from Intelligent Visual Deductive Reasoning?

投稿日: 2024年3月8日作成者: jarxiv

要約 GPT-4V などの視覚言語モデル (VLM) は、最近、多様な視覚言語タ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Q&A Prompts: Discovering Rich Visual Clues through Mining Question-Answer Prompts for VQA requiring Diverse World Knowledge

投稿日: 2024年3月8日作成者: jarxiv

要約マルチモーダルな大規模言語モデルの画期的な進歩により、高度な推論能力と世界 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

RACE-SM: Reinforcement Learning Based Autonomous Control for Social On-Ramp Merging

投稿日: 2024年3月7日作成者: jarxiv

要約人間が制御する交通における自律並列スタイルの入口ランプ合流は、引き続き自律 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

SceneVerse: Scaling 3D Vision-Language Learning for Grounded Scene Understanding

投稿日: 2024年3月7日作成者: jarxiv

要約言語を 3D 物理環境に合わせることに焦点を当てた 3D 視覚と言語の基礎 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Continual Driving Policy Optimization with Closed-Loop Individualized Curricula

投稿日: 2024年3月7日作成者: jarxiv

要約自動運転車 (AV) の安全性は長年にわたる最大の懸案事項であり、これはロ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Prompt Mining for Language-based Human Mobility Forecasting

投稿日: 2024年3月7日作成者: jarxiv

要約大規模な言語モデルの進歩により、言語ベースの予測が人間の移動パターンを予測 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

gaHealth: An English-Irish Bilingual Corpus of Health Data

投稿日: 2024年3月7日作成者: jarxiv

要約機械翻訳は、多くの高リソース言語ペアにとって成熟したテクノロジーです。た … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Arithmetic with Language Models: from Memorization to Computation

投稿日: 2024年3月7日作成者: jarxiv

要約最近の大規模な言語モデルの新たな計算能力と問題解決能力をより深く理解するこ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Learning Abstract Visual Reasoning via Task Decomposition: A Case Study in Raven Progressive Matrices

VeCLIP: Improving CLIP Training via Visual-enriched Captions

How Far Are We from Intelligent Visual Deductive Reasoning?

Q&A Prompts: Discovering Rich Visual Clues through Mining Question-Answer Prompts for VQA requiring Diverse World Knowledge

RACE-SM: Reinforcement Learning Based Autonomous Control for Social On-Ramp Merging

SceneVerse: Scaling 3D Vision-Language Learning for Grounded Scene Understanding

Continual Driving Policy Optimization with Closed-Loop Individualized Curricula

Prompt Mining for Language-based Human Mobility Forecasting

gaHealth: An English-Irish Bilingual Corpus of Health Data

Arithmetic with Language Models: from Memorization to Computation

最近の投稿

最近のコメント

アーカイブ

カテゴリー