-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
OmniBench: Towards The Future of Universal Omni-Language Models
要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩は、多様なモダリ … 続きを読む
Label-Augmented Dataset Distillation
要約 従来のデータセットの抽出では、主に画像表現に焦点を当てていましたが、ラベル … 続きを読む
Fields of The World: A Machine Learning Benchmark Dataset For Global Agricultural Field Boundary Segmentation
要約 作物畑の境界は、農業の監視と評価のための基礎的なデータセットですが、手動で … 続きを読む
Takin: A Cohort of Superior Quality Zero-shot Speech Generation Models
要約 ビッグデータと大規模言語モデル時代の到来により、ゼロショットでパーソナライ … 続きを読む
Takin: A Cohort of Superior Quality Zero-shot Speech Generation Models
要約 ビッグデータと大規模言語モデル時代の到来により、ゼロショットでパーソナライ … 続きを読む
Autoregressive + Chain of Thought = Recurrent: Recurrence’s Role in Language Models’ Computability and a Revisit of Recurrent Transformer
要約 Transformer アーキテクチャは、さまざまな言語モデリング タスク … 続きを読む
LOLA — An Open-Source Massively Multilingual Large Language Model
要約 この論文では、疎な専門家混合トランスフォーマー アーキテクチャを使用して … 続きを読む
Representing Positional Information in Generative World Models for Object Manipulation
要約 オブジェクト操作能力は、特にロボット工学の分野で、世界と関わる具体化された … 続きを読む
One Map to Find Them All: Real-time Open-Vocabulary Mapping for Zero-shot Multi-Object Navigation
要約 複雑な環境でオブジェクトを効率的に検索する機能は、現実世界の多くのロボット … 続きを読む
Learning Task Planning from Multi-Modal Demonstration for Multi-Stage Contact-Rich Manipulation
要約 大規模言語モデル (LLM) は、長期にわたる操作タスクのタスク計画におい … 続きを読む