-
最近の投稿
- From Structural Design to Dynamics Modeling: Control-Oriented Development of a 3-RRR Parallel Ankle Rehabilitation Robot
- Building reliable sim driving agents by scaling self-play
- C*: A Coverage Path Planning Algorithm for Unknown Environments using Rapidly Covering Graphs
- RoCoDA: Counterfactual Data Augmentation for Data-Efficient Robot Learning from Demonstrations
- Toward Real-World Cooperative and Competitive Soccer with Quadrupedal Robot Teams
-
最近のコメント
表示できるコメントはありません。 cs.AI (38401) cs.CL (29012) cs.CV (43912) cs.HC (2935) cs.LG (43326) cs.RO (22872) cs.SY (3509) eess.IV (5082) eess.SY (3501) stat.ML (5638)
月別アーカイブ: 2025年2月
OpenTAD: A Unified Framework and Comprehensive Study of Temporal Action Detection
要約 時間的アクション検出(TAD)は、人間の行動を特定し、ビデオ内の時間的境界 … 続きを読む
カテゴリー: cs.CV
OpenTAD: A Unified Framework and Comprehensive Study of Temporal Action Detection はコメントを受け付けていません
Ready-to-React: Online Reaction Policy for Two-Character Interaction Generation
要約 このペーパーでは、2文字のオンラインインタラクションを生成するタスクに対処 … 続きを読む
カテゴリー: cs.CV
Ready-to-React: Online Reaction Policy for Two-Character Interaction Generation はコメントを受け付けていません
Tight Inversion: Image-Conditioned Inversion for Real Image Editing
要約 テキストから画像への拡散モデルは、強力な画像編集機能を提供します。 実際の … 続きを読む
Efficient Gaussian Splatting for Monocular Dynamic Scene Rendering via Sparse Time-Variant Attribute Modeling
要約 単眼ビデオから動的なシーンをレンダリングすることは、重要でありながら挑戦的 … 続きを読む
カテゴリー: cs.CV
Efficient Gaussian Splatting for Monocular Dynamic Scene Rendering via Sparse Time-Variant Attribute Modeling はコメントを受け付けていません
InsTaG: Learning Personalized 3D Talking Head from Few-Second Video
要約 リアルなパーソナライズされた3Dトーキングヘッドを合成する際に印象的なパフ … 続きを読む
カテゴリー: cs.CV
InsTaG: Learning Personalized 3D Talking Head from Few-Second Video はコメントを受け付けていません
Beyond Next-Token: Next-X Prediction for Autoregressive Visual Generation
要約 次のトークン予測パラダイムで知られているオートレーフレフ(AR)モデリング … 続きを読む
カテゴリー: cs.CV
Beyond Next-Token: Next-X Prediction for Autoregressive Visual Generation はコメントを受け付けていません
LIFT-GS: Cross-Scene Render-Supervised Distillation for 3D Language Grounding
要約 3Dビジョンと言語の理解モデルをトレーニングするためのアプローチは、3Dで … 続きを読む
カテゴリー: cs.CV
LIFT-GS: Cross-Scene Render-Supervised Distillation for 3D Language Grounding はコメントを受け付けていません
InterMimic: Towards Universal Whole-Body Control for Physics-Based Human-Object Interactions
要約 広範囲のオブジェクトと相互作用する人間の現実的なシミュレーションを達成する … 続きを読む
Walking the Web of Concept-Class Relationships in Incrementally Trained Interpretable Models
要約 概念ベースの方法は、標準的な監視設定で解釈可能なニューラルネットワークを開 … 続きを読む