月別アーカイブ: 2024年3月

Score-Guided Diffusion for 3D Human Recovery

要約 3D 人間のポーズと形状の再構成の逆問題を解決するためのアプローチである、 … 続きを読む

カテゴリー: cs.CV | Score-Guided Diffusion for 3D Human Recovery はコメントを受け付けていません

Make-Your-3D: Fast and Consistent Subject-Driven 3D Content Generation

要約 近年、3D 生成モデルの強力なパワーが実証されており、ユーザーが 1 つの … 続きを読む

カテゴリー: cs.CV, cs.LG | Make-Your-3D: Fast and Consistent Subject-Driven 3D Content Generation はコメントを受け付けていません

Video Mamba Suite: State Space Model as a Versatile Alternative for Video Understanding

要約 ビデオを理解することはコンピューター ビジョン研究の基本的な方向性の 1 … 続きを読む

カテゴリー: cs.CV | Video Mamba Suite: State Space Model as a Versatile Alternative for Video Understanding はコメントを受け付けていません

HumanGaussian: Text-Driven 3D Human Generation with Gaussian Splatting

要約 テキスト プロンプトからリアルな 3D 人間を生成することは、望ましいこと … 続きを読む

カテゴリー: cs.CV | HumanGaussian: Text-Driven 3D Human Generation with Gaussian Splatting はコメントを受け付けていません

Generalized Predictive Model for Autonomous Driving

要約 この論文では、自動運転分野における初の大規模ビデオ予測モデルを紹介します。 … 続きを読む

カテゴリー: cs.CV | Generalized Predictive Model for Autonomous Driving はコメントを受け付けていません

3D-VLA: A 3D Vision-Language-Action Generative World Model

要約 最近のビジョン言語アクション (VLA) モデルは 2D 入力に依存してお … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | 3D-VLA: A 3D Vision-Language-Action Generative World Model はコメントを受け付けていません

Holo-Relighting: Controllable Volumetric Portrait Relighting from a Single Image

要約 ポートレート写真の核心は、理想的な照明と視点の探求です。 このプロセスでは … 続きを読む

カテゴリー: cs.CV | Holo-Relighting: Controllable Volumetric Portrait Relighting from a Single Image はコメントを受け付けていません

OneTracker: Unifying Visual Object Tracking with Foundation Models and Efficient Tuning

要約 視覚オブジェクト追跡は、最初のフレームでの最初の出現に基づいて各フレームの … 続きを読む

カテゴリー: cs.CV | OneTracker: Unifying Visual Object Tracking with Foundation Models and Efficient Tuning はコメントを受け付けていません

Transformers Get Stable: An End-to-End Signal Propagation Theory for Language Models

要約 変圧器モデルは大成功を収めているにもかかわらず、依然として詳細に拡張するこ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, I.2.10 | Transformers Get Stable: An End-to-End Signal Propagation Theory for Language Models はコメントを受け付けていません

A Data Perspective on Enhanced Identity Preservation for Diffusion Personalization

要約 大規模なテキストから画像へのモデルは、自然言語を使用して画像を生成する機能 … 続きを読む

カテゴリー: cs.CV | A Data Perspective on Enhanced Identity Preservation for Diffusion Personalization はコメントを受け付けていません