cs.CV」カテゴリーアーカイブ

ImageRAG: Dynamic Image Retrieval for Reference-Guided Image Generation

要約 拡散モデルにより、高品質で多様な視覚コンテンツの合成が可能になります。 し … 続きを読む

カテゴリー: cs.CV, cs.GR | ImageRAG: Dynamic Image Retrieval for Reference-Guided Image Generation はコメントを受け付けていません

Diffusion Transformer Policy: Scaling Diffusion Transformer for Generalist Vision-Language-Action Learning

要約 多様なロボットデータセットで前提とされた最近の大きなビジョン言語アクション … 続きを読む

カテゴリー: cs.CV, cs.RO | Diffusion Transformer Policy: Scaling Diffusion Transformer for Generalist Vision-Language-Action Learning はコメントを受け付けていません

ADBM: Adversarial diffusion bridge model for reliable adversarial purification

要約 最近、拡散ベースの精製(拡散)は、敵対例に対する効果的な防御方法として認識 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | ADBM: Adversarial diffusion bridge model for reliable adversarial purification はコメントを受け付けていません

A 3D Facial Reconstruction Evaluation Methodology: Comparing Smartphone Scans with Deep Learning Based Methods Using Geometry and Morphometry Criteria

要約 潜在的な臨床応用により、3次元(3D)顔形分析が関心を集めています。 ただ … 続きを読む

カテゴリー: cs.CV | A 3D Facial Reconstruction Evaluation Methodology: Comparing Smartphone Scans with Deep Learning Based Methods Using Geometry and Morphometry Criteria はコメントを受け付けていません

Redistribute Ensemble Training for Mitigating Memorization in Diffusion Models

要約 高品質のサンプルを生成する途方もない能力で知られる拡散モデルは、最近、プラ … 続きを読む

カテゴリー: cs.CV | Redistribute Ensemble Training for Mitigating Memorization in Diffusion Models はコメントを受け付けていません

Gaussian-Det: Learning Closed-Surface Gaussians for 3D Object Detection

要約 私たちの体の周りに包まれ、ソファの上を覆う革は、車を覆う板金コーティング … 続きを読む

カテゴリー: cs.CV | Gaussian-Det: Learning Closed-Surface Gaussians for 3D Object Detection はコメントを受け付けていません

On the Importance of Backbone to the Adversarial Robustness of Object Detectors

要約 オブジェクト検出は、自律運転やビデオ監視など、さまざまなセキュリティに敏感 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG | On the Importance of Backbone to the Adversarial Robustness of Object Detectors はコメントを受け付けていません

Pixel-Level Reasoning Segmentation via Multi-turn Conversations

要約 既存の視覚認識システムは、複雑で明示的なクエリの指示に依存して、一ターンダ … 続きを読む

カテゴリー: cs.CL, cs.CV | Pixel-Level Reasoning Segmentation via Multi-turn Conversations はコメントを受け付けていません

4-LEGS: 4D Language Embedded Gaussian Splatting

要約 神経表現の出現は、幅広い3Dシーンをデジタル的に表示するための私たちの手段 … 続きを読む

カテゴリー: cs.CV, cs.GR | 4-LEGS: 4D Language Embedded Gaussian Splatting はコメントを受け付けていません

Sitcom-Crafter: A Plot-Driven Human Motion Generation System in 3D Scenes

要約 人間の動き統合における最近の進歩は、人間のシーンの相互作用、移動、人間の相 … 続きを読む

カテゴリー: cs.CV | Sitcom-Crafter: A Plot-Driven Human Motion Generation System in 3D Scenes はコメントを受け付けていません