cs.AI」カテゴリーアーカイブ

RoPECraft: Training-Free Motion Transfer with Trajectory-Guided RoPE Optimization on Diffusion Transformers

要約 Ropecraftを提案します。Ropecraftは、回転式位置埋め込み( … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | RoPECraft: Training-Free Motion Transfer with Trajectory-Guided RoPE Optimization on Diffusion Transformers はコメントを受け付けていません

Advancing Generalization Across a Variety of Abstract Visual Reasoning Tasks

要約 抽象的な視覚推論(AVR)ドメインは、モデルの一般化の研究に専念する類推ベ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Advancing Generalization Across a Variety of Abstract Visual Reasoning Tasks はコメントを受け付けていません

MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision

要約 マルチモーダルの大手言語モデル(MLLM)は視覚言語の理解において印象的な … 続きを読む

カテゴリー: cs.AI, cs.CV | MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision はコメントを受け付けていません

FinePhys: Fine-grained Human Action Generation by Explicitly Incorporating Physical Laws for Effective Skeletal Guidance

要約 ビデオ生成の大幅な進歩にもかかわらず、特に細粒のセマンティクスと複雑な時間 … 続きを読む

カテゴリー: cs.AI, cs.CV | FinePhys: Fine-grained Human Action Generation by Explicitly Incorporating Physical Laws for Effective Skeletal Guidance はコメントを受け付けていません

VTBench: Evaluating Visual Tokenizers for Autoregressive Image Generation

要約 自己回帰(AR)モデルは最近、画像生成で強力なパフォーマンスを示しています … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | VTBench: Evaluating Visual Tokenizers for Autoregressive Image Generation はコメントを受け付けていません

Cosmos-Reason1: From Physical Common Sense To Embodied Reasoning

要約 物理的なAIシステムは、物理的な世界で複雑な行動を認識し、理解し、実行する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Cosmos-Reason1: From Physical Common Sense To Embodied Reasoning はコメントを受け付けていません

REI-Bench: Can Embodied Agents Understand Vague Human Instructions in Task Planning?

要約 ロボットタスク計画は、ロボットが一連の複雑なタスクを完了できるようにする実 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.RO | REI-Bench: Can Embodied Agents Understand Vague Human Instructions in Task Planning? はコメントを受け付けていません

DexGarmentLab: Dexterous Garment Manipulation Environment with Generalizable Policy

要約 衣服の操作は、衣服のカテゴリ、幾何学、変形の多様性のために重大な課題です。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | DexGarmentLab: Dexterous Garment Manipulation Environment with Generalizable Policy はコメントを受け付けていません

Phare: A Safety Probe for Large Language Models

要約 大規模な言語モデル(LLMS)の安全性を確保することは責任ある展開に重要で … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.CY | Phare: A Safety Probe for Large Language Models はコメントを受け付けていません

Real-Time Verification of Embodied Reasoning for Generative Skill Acquisition

要約 生成スキルの習得により、具体化されたエージェントは、大規模な意思決定モデル … 続きを読む

カテゴリー: cs.AI, cs.RO | Real-Time Verification of Embodied Reasoning for Generative Skill Acquisition はコメントを受け付けていません