cs.CV」カテゴリーアーカイブ

Enhancing Canine Musculoskeletal Diagnoses: Leveraging Synthetic Image Data for Pre-Training AI-Models on Visual Documentations

要約 犬の筋骨格系の検査は、獣医の現場において困難な課題です。 この研究では、視 … 続きを読む

カテゴリー: cs.CV | Enhancing Canine Musculoskeletal Diagnoses: Leveraging Synthetic Image Data for Pre-Training AI-Models on Visual Documentations はコメントを受け付けていません

Gaussian Garments: Reconstructing Simulation-Ready Clothing with Photorealistic Appearance from Multi-View Video

要約 マルチビュー ビデオからリアルなシミュレーション対応の衣服アセットを再構築 … 続きを読む

カテゴリー: cs.CV, cs.GR | Gaussian Garments: Reconstructing Simulation-Ready Clothing with Photorealistic Appearance from Multi-View Video はコメントを受け付けていません

DINOv2 Rocks Geological Image Analysis: Classification, Segmentation, and Interpretability

要約 コンピューター ビジョンの最近の進歩により、画像分析タスクが大幅に改善され … 続きを読む

カテゴリー: cs.CV, physics.geo-ph | DINOv2 Rocks Geological Image Analysis: Classification, Segmentation, and Interpretability はコメントを受け付けていません

What Makes a Maze Look Like a Maze?

要約 人間の視覚的理解のユニークな側面は、抽象的な概念を柔軟に解釈する能力です。 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | What Makes a Maze Look Like a Maze? はコメントを受け付けていません

ComAlign: Compositional Alignment in Vision-Language Models

要約 CLIP のようなビジョン言語モデル (VLM) は、下流のタスクに転送可 … 続きを読む

カテゴリー: cs.CV, cs.MM | ComAlign: Compositional Alignment in Vision-Language Models はコメントを受け付けていません

VI3DRM:Towards meticulous 3D Reconstruction from Sparse Views via Photo-Realistic Novel View Synthesis

要約 最近では、Zero-1-2-3 のような手法が単一ビュー ベースの 3D … 続きを読む

カテゴリー: cs.CV | VI3DRM:Towards meticulous 3D Reconstruction from Sparse Views via Photo-Realistic Novel View Synthesis はコメントを受け付けていません

LT3SD: Latent Trees for 3D Scene Diffusion

要約 我々は、大規模な 3D シーン生成のための新しい潜在拡散モデル LT3SD … 続きを読む

カテゴリー: cs.AI, cs.CV | LT3SD: Latent Trees for 3D Scene Diffusion はコメントを受け付けていません

What Makes a Face Look like a Hat: Decoupling Low-level and High-level Visual Properties with Image Triplets

要約 視覚的な意思決定では、オブジェクト カテゴリなどの高レベルの機能が選択に大 … 続きを読む

カテゴリー: cs.CV, q-bio.NC | What Makes a Face Look like a Hat: Decoupling Low-level and High-level Visual Properties with Image Triplets はコメントを受け付けていません

Model Ensemble for Brain Tumor Segmentation in Magnetic Resonance Imaging

要約 マルチパラメトリック磁気共鳴画像法で脳腫瘍をセグメント化することにより、臨 … 続きを読む

カテゴリー: cs.CV, eess.IV | Model Ensemble for Brain Tumor Segmentation in Magnetic Resonance Imaging はコメントを受け付けていません

IFAdapter: Instance Feature Control for Grounded Text-to-Image Generation

要約 Text-to-Image (T2I) 拡散モデルは、個々のインスタンスの … 続きを読む

カテゴリー: cs.AI, cs.CV | IFAdapter: Instance Feature Control for Grounded Text-to-Image Generation はコメントを受け付けていません