月別アーカイブ: 2024年3月

GauStudio: A Modular Framework for 3D Gaussian Splatting and Beyond

要約 3D ガウス スプラッティング (3DGS) をモデリングするための新しい … 続きを読む

カテゴリー: cs.CV | GauStudio: A Modular Framework for 3D Gaussian Splatting and Beyond はコメントを受け付けていません

Siamese Vision Transformers are Scalable Audio-visual Learners

要約 従来のオーディオビジュアル手法は、独立したオーディオとビジュアルのバックボ … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Siamese Vision Transformers are Scalable Audio-visual Learners はコメントを受け付けていません

Learnable Earth Parser: Discovering 3D Prototypes in Aerial Scans

要約 我々は、容易に解釈可能な形状を持つ現実世界のシーンの大規模な 3D スキャ … 続きを読む

カテゴリー: cs.CV | Learnable Earth Parser: Discovering 3D Prototypes in Aerial Scans はコメントを受け付けていません

GANTASTIC: GAN-based Transfer of Interpretable Directions for Disentangled Image Editing in Text-to-Image Diffusion Models

要約 画像生成モデルの急速な進歩は主に拡散モデルによって推進されており、テキスト … 続きを読む

カテゴリー: cs.CV | GANTASTIC: GAN-based Transfer of Interpretable Directions for Disentangled Image Editing in Text-to-Image Diffusion Models はコメントを受け付けていません

Direct Superpoints Matching for Robust Point Cloud Registration

要約 ディープ ニューラル ネットワークは、ダウンサンプリングされたスーパーポイ … 続きを読む

カテゴリー: cs.CV | Direct Superpoints Matching for Robust Point Cloud Registration はコメントを受け付けていません

Change-Agent: Towards Interactive Comprehensive Change Interpretation and Analysis from Change Detection and Change Captioning

要約 地表の変化を監視することは、自然のプロセスと人間の影響を理解するために非常 … 続きを読む

カテゴリー: cs.CV | Change-Agent: Towards Interactive Comprehensive Change Interpretation and Analysis from Change Detection and Change Captioning はコメントを受け付けていません

GraspXL: Generating Grasping Motions for Diverse Objects at Scale

要約 人間の手は、物体の特定の部分を掴んだり、目的の方向から近づいたりするなど、 … 続きを読む

カテゴリー: cs.CV, cs.RO | GraspXL: Generating Grasping Motions for Diverse Objects at Scale はコメントを受け付けていません

ACT-Diffusion: Efficient Adversarial Consistency Training for One-step Diffusion Models

要約 拡散モデルは画像生成には優れていますが、段階的にノイズ除去を行うため、生成 … 続きを読む

カテゴリー: cs.CV | ACT-Diffusion: Efficient Adversarial Consistency Training for One-step Diffusion Models はコメントを受け付けていません

MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions

要約 画像検索、つまり参照画像から目的の画像を見つけることには、本質的に豊富で多 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.MM | MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions はコメントを受け付けていません

InterDreamer: Zero-Shot Text to 3D Dynamic Human-Object Interaction

要約 テキスト条件付き人間モーション生成は、広範なモーション キャプチャ データ … 続きを読む

カテゴリー: cs.AI, cs.CV | InterDreamer: Zero-Shot Text to 3D Dynamic Human-Object Interaction はコメントを受け付けていません