cs.CV」カテゴリーアーカイブ

Latent Radiance Fields with 3D-aware 2D Representations

要約 潜在的な3D再構成は、2D機能を3Dスペースに蒸留することにより、3Dセマ … 続きを読む

カテゴリー: cs.CV | Latent Radiance Fields with 3D-aware 2D Representations はコメントを受け付けていません

Opening Articulated Objects in the Real World

要約 以前に見えなかった環境で、以前に見えなかったオブジェクトで有能に動作できる … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Opening Articulated Objects in the Real World はコメントを受け付けていません

RigAnything: Template-Free Autoregressive Rigging for Diverse 3D Assets

要約 新しい自己回帰変圧器ベースのモデルであるRiganythingを提示します … 続きを読む

カテゴリー: cs.CV | RigAnything: Template-Free Autoregressive Rigging for Diverse 3D Assets はコメントを受け付けていません

DexTrack: Towards Generalizable Neural Tracking Control for Dexterous Manipulation from Human References

要約 人間の参照からの器用な操作のための一般化可能なニューラル追跡コントローラー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | DexTrack: Towards Generalizable Neural Tracking Control for Dexterous Manipulation from Human References はコメントを受け付けていません

Variational Rectified Flow Matching

要約 マルチモーダル速度ベクトルフィールドをモデル化することにより、古典的な修正 … 続きを読む

カテゴリー: cs.CV, cs.LG | Variational Rectified Flow Matching はコメントを受け付けていません

LIFe-GoM: Generalizable Human Rendering with Learned Iterative Feedback Over Multi-Resolution Gaussians-on-Mesh

要約 スパース入力からのアニメーション可能なヒトアバターの一般化可能なレンダリン … 続きを読む

カテゴリー: cs.CV | LIFe-GoM: Generalizable Human Rendering with Learned Iterative Feedback Over Multi-Resolution Gaussians-on-Mesh はコメントを受け付けていません

Can this Model Also Recognize Dogs? Zero-Shot Model Search from Weights

要約 公開されているモデルの数が増えているため、ユーザーが必要とするほとんどのタ … 続きを読む

カテゴリー: cs.CV, cs.LG | Can this Model Also Recognize Dogs? Zero-Shot Model Search from Weights はコメントを受け付けていません

Exploring the Potential of Encoder-free Architectures in 3D LMMs

要約 エンコーダーフリーのアーキテクチャは、2Dビジュアルドメインで事前に検討さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Exploring the Potential of Encoder-free Architectures in 3D LMMs はコメントを受け付けていません

MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency

要約 チェーンオブシュート(COT)で質問に答えることで、大規模な言語モデル(L … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency はコメントを受け付けていません

Embed Any NeRF: Graph Meta-Networks for Neural Tasks on Arbitrary NeRF Architectures

要約 ニューラル放射輝度フィールド(NERF)は、神経ネットワークの重みに形状と … 続きを読む

カテゴリー: cs.CV | Embed Any NeRF: Graph Meta-Networks for Neural Tasks on Arbitrary NeRF Architectures はコメントを受け付けていません