-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
LLaVA-PruMerge: Adaptive Token Reduction for Efficient Large Multimodal Models
要約 大規模マルチモーダル モデル (LMM) は、ビジュアル エンコーダーと大 … 続きを読む
Videoshop: Localized Semantic Video Editing with Noise-Extrapolated Diffusion Inversion
要約 ローカライズされたセマンティック編集のためのトレーニング不要のビデオ編集ア … 続きを読む
Unimodal Multi-Task Fusion for Emotional Mimicry Prediction
要約 この研究では、第 6 回ワークショップおよび野外での感情行動分析に関するコ … 続きを読む
AnyV2V: A Plug-and-Play Framework For Any Video-to-Video Editing Tasks
要約 ビデオ間の編集には、ソース ビデオを追加のコントロール (テキスト プロン … 続きを読む
Knowledge-Enhanced Recommendation with User-Centric Subgraph Network
要約 レコメンデーション システムは、現在さまざまなプラットフォームで広く実装さ … 続きを読む
CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds
要約 この論文では、乳児の泣き声にラベルを付けたコレクションである Ubenwa … 続きを読む
TD-MPC2: Scalable, Robust World Models for Continuous Control
要約 TD-MPC は、学習された暗黙的 (デコーダーなし) ワールド モデルの … 続きを読む
Distilling and Retrieving Generalizable Knowledge for Robot Manipulation via Language Corrections
要約 今日のロボット ポリシーは、新しい環境に一般化するという課題に直面すると、 … 続きを読む
Leveraging Large Language Model-based Room-Object Relationships Knowledge for Enhancing Multimodal-Input Object Goal Navigation
要約 オブジェクトとゴールのナビゲーションは、身体的ナビゲーションのコミュニティ … 続きを読む
SLIM: Skill Learning with Multiple Critics
要約 自己監視型スキル学習は、環境の根底にある力学を活用する有用な行動を獲得する … 続きを読む