-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
RoPECraft: Training-Free Motion Transfer with Trajectory-Guided RoPE Optimization on Diffusion Transformers
要約 Ropecraftを提案します。Ropecraftは、回転式位置埋め込み( … 続きを読む
Advancing Generalization Across a Variety of Abstract Visual Reasoning Tasks
要約 抽象的な視覚推論(AVR)ドメインは、モデルの一般化の研究に専念する類推ベ … 続きを読む
MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision
要約 マルチモーダルの大手言語モデル(MLLM)は視覚言語の理解において印象的な … 続きを読む
FinePhys: Fine-grained Human Action Generation by Explicitly Incorporating Physical Laws for Effective Skeletal Guidance
要約 ビデオ生成の大幅な進歩にもかかわらず、特に細粒のセマンティクスと複雑な時間 … 続きを読む
VTBench: Evaluating Visual Tokenizers for Autoregressive Image Generation
要約 自己回帰(AR)モデルは最近、画像生成で強力なパフォーマンスを示しています … 続きを読む
Cosmos-Reason1: From Physical Common Sense To Embodied Reasoning
要約 物理的なAIシステムは、物理的な世界で複雑な行動を認識し、理解し、実行する … 続きを読む
REI-Bench: Can Embodied Agents Understand Vague Human Instructions in Task Planning?
要約 ロボットタスク計画は、ロボットが一連の複雑なタスクを完了できるようにする実 … 続きを読む
DexGarmentLab: Dexterous Garment Manipulation Environment with Generalizable Policy
要約 衣服の操作は、衣服のカテゴリ、幾何学、変形の多様性のために重大な課題です。 … 続きを読む
Phare: A Safety Probe for Large Language Models
要約 大規模な言語モデル(LLMS)の安全性を確保することは責任ある展開に重要で … 続きを読む
Real-Time Verification of Embodied Reasoning for Generative Skill Acquisition
要約 生成スキルの習得により、具体化されたエージェントは、大規模な意思決定モデル … 続きを読む