-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Memorize What Matters: Emergent Scene Decomposition from Multitraverse
要約 人間は自然に永続的な要素の記憶を保持しますが、一時的な瞬間はしばしば記憶の … 続きを読む
MAML MOT: Multiple Object Tracking based on Meta-Learning
要約 ビデオ分析技術の進歩に伴い、歩行者が関与する複雑なシーンにおけるマルチオブ … 続きを読む
Generative Plant Growth Simulation from Sequence-Informed Environmental Conditions
要約 植物成長シミュレーションは、植物または植物システムの再構成された視覚的表現 … 続きを読む
Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability
要約 ワールドモデルはさまざまなアクションの結果を予測できますが、これは自動運転 … 続きを読む
MultiOOD: Scaling Out-of-Distribution Detection for Multiple Modalities
要約 自動運転やロボット支援手術などの安全性が重要なアプリケーションに機械学習モ … 続きを読む
Hardness-Aware Scene Synthesis for Semi-Supervised 3D Object Detection
要約 3D 物体検出は、関連する物体の 3D 情報を復元することを目的としており … 続きを読む
GaussianFormer: Scene as Gaussians for Vision-Based 3D Semantic Occupancy Prediction
要約 3D セマンティック占有予測は、周囲のシーンの 3D のきめの細かいジオメ … 続きを読む
Matryoshka Multimodal Models
要約 LLaVA などの大規模マルチモーダル モデル (LMM) は、視覚言語推 … 続きを読む
Leveraging Logical Rules in Knowledge Editing: A Cherry on the Top
要約 知識編集 (KE) の下でのマルチホップ質問応答 (MQA) は、大規模言 … 続きを読む
Leveraging Unknown Objects to Construct Labeled-Unlabeled Meta-Relationships for Zero-Shot Object Navigation
要約 ゼロショット オブジェクト ナビゲーション (ZSON) は、トレーニング … 続きを読む