-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Will GPT-4 Run DOOM?
要約 GPT-4 の推論と計画能力が 1993 年の一人称シューティング ゲーム … 続きを読む
Poly-View Contrastive Learning
要約 対照学習では通常、多数の無関係な否定的なビューの中から関連するビューのペア … 続きを読む
Tell, Don’t Show!: Language Guidance Eases Transfer Across Domains in Images and Videos
要約 LaGTran は、すぐに利用できる、または簡単に取得できるテキスト記述を … 続きを読む
Can LLMs Follow Simple Rules?
要約 大規模言語モデル (LLM) は現実世界での責任が増大するにつれて展開され … 続きを読む
Pix2Gif: Motion-Guided Diffusion for GIF Generation
要約 私たちは、画像から GIF (ビデオ) への生成のためのモーションガイド付 … 続きを読む
DNAct: Diffusion Guided Multi-Task 3D Policy Learning
要約 この論文では、ニューラル レンダリングの事前トレーニングと拡散トレーニング … 続きを読む
Context-Based Multimodal Fusion
要約 さまざまなソースからの情報を効果的に組み合わせる融合モデルは、マルチモーダ … 続きを読む
Do Large Language Model Understand Multi-Intent Spoken Language ?
要約 この研究は、多目的音声言語理解 (SLU) に大規模言語モデル (LLM) … 続きを読む
Explaining Bayesian Optimization by Shapley Values Facilitates Human-AI Collaboration
要約 ガウスプロセス (GP) を使用したベイジアン最適化 (BO) は、ブラッ … 続きを読む
How Far Are We from Intelligent Visual Deductive Reasoning?
要約 GPT-4V などの視覚言語モデル (VLM) は、最近、多様な視覚言語タ … 続きを読む