「cs.CV」カテゴリーアーカイブ

ImageRAG: Dynamic Image Retrieval for Reference-Guided Image Generation

投稿日: 2025年2月14日作成者: jarxiv

要約拡散モデルにより、高品質で多様な視覚コンテンツの合成が可能になります。し … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

Diffusion Transformer Policy: Scaling Diffusion Transformer for Generalist Vision-Language-Action Learning

投稿日: 2025年2月14日作成者: jarxiv

要約多様なロボットデータセットで前提とされた最近の大きなビジョン言語アクション … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

ADBM: Adversarial diffusion bridge model for reliable adversarial purification

投稿日: 2025年2月14日作成者: jarxiv

要約最近、拡散ベースの精製（拡散）は、敵対例に対する効果的な防御方法として認識 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

A 3D Facial Reconstruction Evaluation Methodology: Comparing Smartphone Scans with Deep Learning Based Methods Using Geometry and Morphometry Criteria

投稿日: 2025年2月14日作成者: jarxiv

要約潜在的な臨床応用により、3次元（3D）顔形分析が関心を集めています。ただ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Redistribute Ensemble Training for Mitigating Memorization in Diffusion Models

投稿日: 2025年2月14日作成者: jarxiv

要約高品質のサンプルを生成する途方もない能力で知られる拡散モデルは、最近、プラ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Gaussian-Det: Learning Closed-Surface Gaussians for 3D Object Detection

投稿日: 2025年2月14日作成者: jarxiv

要約私たちの体の周りに包まれ、ソファの上を覆う革は、車を覆う板金コーティング … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

On the Importance of Backbone to the Adversarial Robustness of Object Detectors

投稿日: 2025年2月14日作成者: jarxiv

要約オブジェクト検出は、自律運転やビデオ監視など、さまざまなセキュリティに敏感 … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG | コメントを受け付けていません

Pixel-Level Reasoning Segmentation via Multi-turn Conversations

投稿日: 2025年2月14日作成者: jarxiv

要約既存の視覚認識システムは、複雑で明示的なクエリの指示に依存して、一ターンダ … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

4-LEGS: 4D Language Embedded Gaussian Splatting

投稿日: 2025年2月14日作成者: jarxiv

要約神経表現の出現は、幅広い3Dシーンをデジタル的に表示するための私たちの手段 … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

Sitcom-Crafter: A Plot-Driven Human Motion Generation System in 3D Scenes

投稿日: 2025年2月14日作成者: jarxiv

要約人間の動き統合における最近の進歩は、人間のシーンの相互作用、移動、人間の相 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

ImageRAG: Dynamic Image Retrieval for Reference-Guided Image Generation

Diffusion Transformer Policy: Scaling Diffusion Transformer for Generalist Vision-Language-Action Learning

ADBM: Adversarial diffusion bridge model for reliable adversarial purification

A 3D Facial Reconstruction Evaluation Methodology: Comparing Smartphone Scans with Deep Learning Based Methods Using Geometry and Morphometry Criteria

Redistribute Ensemble Training for Mitigating Memorization in Diffusion Models

Gaussian-Det: Learning Closed-Surface Gaussians for 3D Object Detection

On the Importance of Backbone to the Adversarial Robustness of Object Detectors

Pixel-Level Reasoning Segmentation via Multi-turn Conversations

4-LEGS: 4D Language Embedded Gaussian Splatting

Sitcom-Crafter: A Plot-Driven Human Motion Generation System in 3D Scenes

最近の投稿

最近のコメント

アーカイブ

カテゴリー