-
最近の投稿
- TGRPO :Fine-tuning Vision-Language-Action Model via Trajectory-wise Group Relative Policy Optimization
- Teaching Physical Awareness to LLMs through Sounds
- Through a Steerable Lens: Magnifying Neural Network Interpretability via Phase-Based Extrapolation
- On Finetuning Tabular Foundation Models
- Robust Distributed Estimation: Extending Gossip Algorithms to Ranking and Trimmed Means
-
最近のコメント
表示できるコメントはありません。 cs.AI (39476) cs.CL (29878) cs.CV (44831) cs.HC (3006) cs.LG (44408) cs.RO (23597) cs.SY (3595) eess.IV (5140) eess.SY (3587) stat.ML (5767)
「cs.GR」カテゴリーアーカイブ
Fillerbuster: Multi-View Scene Completion for Casual Captures
要約 Fillerbusterを提示します。これは、新しい大規模なマルチビュー潜 … 続きを読む
ImDy: Human Inverse Dynamics from Imitated Observations
要約 人間の運動観察から駆動されるトルクを再現することを目的とする逆ダイナミクス … 続きを読む
Assessing Open-world Forgetting in Generative Image Model Customization
要約 拡散モデルの最近の進歩により、画像生成機能が大幅に向上しています。 ただし … 続きを読む
MotionAgent: Fine-grained Controllable Video Generation via Motion Field Agent
要約 MotionAgentを提案し、テキスト誘導画像からビデオへの生成のための … 続きを読む
Controllable GUI Exploration
要約 インターフェイス設計の初期段階では、デザイナーはデザインスペースを探索する … 続きを読む
Seeing World Dynamics in a Nutshell
要約 私たちは、空間的に一時的に一貫した方法で、さりげなくキャプチャされたモノク … 続きを読む
Learning Cross-hand Policies for High-DOF Reaching and Grasping
要約 リーチングと把持はロボット操作の基本的なスキルであるが、既存の手法は通常、 … 続きを読む
DiffusionRenderer: Neural Inverse and Forward Rendering with Video Diffusion Models
要約 照明効果の理解とモデリングは、コンピュータービジョンとグラフィックスの基本 … 続きを読む
A Survey on Quality Metrics for Text-to-Image Generation
要約 AIベースのテキストから画像へのモデルは、現実的な画像の生成に優れているだ … 続きを読む