月別アーカイブ: 2024年3月

Gamba: Marry Gaussian Splatting with Mamba for single view 3D reconstruction

要約 自動化された 3D コンテンツ作成パイプラインに対する需要が高まる中、私た … 続きを読む

カテゴリー: cs.AI, cs.CV | Gamba: Marry Gaussian Splatting with Mamba for single view 3D reconstruction はコメントを受け付けていません

Shifting to Machine Supervision: Annotation-Efficient Semi and Self-Supervised Learning for Automatic Medical Image Segmentation and Classification

要約 臨床治療の進歩は、大量の注釈付きデータに大きく依存する教師あり学習技術の限 … 続きを読む

カテゴリー: cs.AI, cs.CV | Shifting to Machine Supervision: Annotation-Efficient Semi and Self-Supervised Learning for Automatic Medical Image Segmentation and Classification はコメントを受け付けていません

ECoDepth: Effective Conditioning of Diffusion Models for Monocular Depth Estimation

要約 視差キューがない場合、学習ベースの単一画像奥行き推定 (SIDE) モデル … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | ECoDepth: Effective Conditioning of Diffusion Models for Monocular Depth Estimation はコメントを受け付けていません

Duolando: Follower GPT with Off-Policy Reinforcement Learning for Dance Accompaniment

要約 我々は、3D ダンス生成の分野に、ダンス伴奏と呼ばれる新しいタスクを導入し … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.SD, eess.AS | Duolando: Follower GPT with Off-Policy Reinforcement Learning for Dance Accompaniment はコメントを受け付けていません

Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models

要約 この研究では、マルチモダリティ視覚言語モデル (VLM) を強化するシンプ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models はコメントを受け付けていません

Garment3DGen: 3D Garment Stylization and Texture Generation

要約 単一の入力画像をガイダンスとして与えられたベース メッシュから 3D 衣服 … 続きを読む

カテゴリー: cs.CV | Garment3DGen: 3D Garment Stylization and Texture Generation はコメントを受け付けていません

ObjectDrop: Bootstrapping Counterfactuals for Photorealistic Object Removal and Insertion

要約 拡散モデルは画像編集に革命をもたらしましたが、多くの場合、物理法則、特にオ … 続きを読む

カテゴリー: cs.CV | ObjectDrop: Bootstrapping Counterfactuals for Photorealistic Object Removal and Insertion はコメントを受け付けていません

Benchmarking Object Detectors with COCO: A New Path Forward

要約 Common Objects in Context (COCO) データセ … 続きを読む

カテゴリー: cs.CV | Benchmarking Object Detectors with COCO: A New Path Forward はコメントを受け付けていません

MetaCap: Meta-learning Priors from Multi-View Imagery for Sparse-view Human Performance Capture and Rendering

要約 人間のパフォーマンスを忠実にキャプチャし、まばらな RGB 観察からフリー … 続きを読む

カテゴリー: cs.CV | MetaCap: Meta-learning Priors from Multi-View Imagery for Sparse-view Human Performance Capture and Rendering はコメントを受け付けていません

Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark

要約 複数のモダリティから実際の音響室データをキャプチャする Real Acou … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark はコメントを受け付けていません