-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models
要約 大規模言語モデル (LLM) の目覚ましい進歩を利用して、ロボット ナビゲ … 続きを読む
Rethinking the Integration of Prediction and Planning in Deep Learning-Based Automated Driving Systems: A Review
要約 自動運転は、個人、公共、貨物のモビリティに革命をもたらす可能性があります。 … 続きを読む
Subequivariant Reinforcement Learning in 3D Multi-Entity Physical Environments
要約 3D 環境におけるマルチエンティティ システムの学習ポリシーは、エンティテ … 続きを読む
The Oscars of AI Theater: A Survey on Role-Playing with Language Models
要約 この調査では、言語モデルを使用したロールプレイングの急成長分野を調査し、初 … 続きを読む
Show Me the World in My Language: Establishing the First Baseline for Scene-Text to Scene-Text Translation
要約 この研究では、シーンのテキストをソース言語 (ヒンディー語など) からター … 続きを読む
End-to-End Evaluation for Low-Latency Simultaneous Speech Translation
要約 低遅延音声翻訳の課題は、いくつかの出版物や共有タスクによって示されているよ … 続きを読む
MERLIN: Multimodal Embedding Refinement via LLM-based Iterative Navigation for Text-Video Retrieval-Rerank Pipeline
要約 マルチメディア コンテンツの急速な拡大により、大規模なコレクションから関連 … 続きを読む
Struct-X: Enhancing Large Language Models Reasoning with Structured Data
要約 論理情報とリレーショナル情報が豊富な構造化データには、大規模言語モデル ( … 続きを読む
DotaMath: Decomposition of Thought with Code Assistance and Self-correction for Mathematical Reasoning
要約 大規模言語モデル (LLM) は、単純な数学問題の処理において目覚ましい進 … 続きを読む
Towards Collaborative Intelligence: Propagating Intentions and Reasoning for Multi-Agent Coordination with Large Language Models
要約 マルチエージェント システムで効果的にコラボレーションするには、エージェン … 続きを読む