-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Learning Abstract Visual Reasoning via Task Decomposition: A Case Study in Raven Progressive Matrices
要約 抽象的な推論の実行を学習するには、多くの場合、問題のタスクを中間のサブ目標 … 続きを読む
VeCLIP: Improving CLIP Training via Visual-enriched Captions
要約 Web クロールされた大規模なデータセットは、CLIP などの視覚言語モデ … 続きを読む
How Far Are We from Intelligent Visual Deductive Reasoning?
要約 GPT-4V などの視覚言語モデル (VLM) は、最近、多様な視覚言語タ … 続きを読む
Q&A Prompts: Discovering Rich Visual Clues through Mining Question-Answer Prompts for VQA requiring Diverse World Knowledge
要約 マルチモーダルな大規模言語モデルの画期的な進歩により、高度な推論能力と世界 … 続きを読む
RACE-SM: Reinforcement Learning Based Autonomous Control for Social On-Ramp Merging
要約 人間が制御する交通における自律並列スタイルの入口ランプ合流は、引き続き自律 … 続きを読む
SceneVerse: Scaling 3D Vision-Language Learning for Grounded Scene Understanding
要約 言語を 3D 物理環境に合わせることに焦点を当てた 3D 視覚と言語の基礎 … 続きを読む
Continual Driving Policy Optimization with Closed-Loop Individualized Curricula
要約 自動運転車 (AV) の安全性は長年にわたる最大の懸案事項であり、これはロ … 続きを読む
Prompt Mining for Language-based Human Mobility Forecasting
要約 大規模な言語モデルの進歩により、言語ベースの予測が人間の移動パターンを予測 … 続きを読む
gaHealth: An English-Irish Bilingual Corpus of Health Data
要約 機械翻訳は、多くの高リソース言語ペアにとって成熟したテクノロジーです。 た … 続きを読む
Arithmetic with Language Models: from Memorization to Computation
要約 最近の大規模な言語モデルの新たな計算能力と問題解決能力をより深く理解するこ … 続きを読む