-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Universal Visuo-Tactile Video Understanding for Embodied Interaction
要約 具体的な知覚は、具体化されたエージェントが目視検査だけでは決定できないオブ … 続きを読む
Tell me Habibi, is it Real or Fake?
要約 ディープフェイクの生成方法は急速に進化しており、偽のメディアを検出するのが … 続きを読む
ReLearn: Unlearning via Learning for Large Language Models
要約 大規模な言語モデルの現在の学習方法は、通常、ターゲットトークンの確率を減ら … 続きを読む
SynWorld: Virtual Scenario Synthesis for Agentic Action Knowledge Refinement
要約 エージェントとその環境間の相互作用において、エージェントはアクションを計画 … 続きを読む
RICO: Improving Accuracy and Completeness in Image Recaptioning via Visual Reconstruction
要約 画像の復帰は、さまざまなマルチモーダルタスクの品質が向上したトレーニングデ … 続きを読む
Spatial Knowledge Graph-Guided Multimodal Synthesis
要約 マルチモーダル大手言語モデル(MLLM)の最近の進歩により、能力が大幅に向 … 続きを読む
3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D Large Language Model
要約 人間は、時間的および空間的経験を越えて長期的なメモリを活用することにより、 … 続きを読む
Something’s Fishy In The Data Lake: A Critical Re-evaluation of Table Union Search Benchmarks
要約 最近のテーブル表現学習およびデータ発見方法は、データレイク内のテーブルユニ … 続きを読む
Visuospatial Cognitive Assistant
要約 ビデオベースの空間認知は、ロボット工学と具体化されたAIにとって不可欠です … 続きを読む