cs.CV」カテゴリーアーカイブ

Adaptive Deviation Learning for Visual Anomaly Detection with Data Contamination

要約 視覚的異常検出は、正常なパターンと著しく異なる画像を検出することを目的とし … 続きを読む

カテゴリー: cs.CV, cs.LG | Adaptive Deviation Learning for Visual Anomaly Detection with Data Contamination はコメントを受け付けていません

Diffusion Sampling Correction via Approximately 10 Parameters

要約 拡散確率モデル (DPM) は生成タスクにおいて優れたパフォーマンスを示し … 続きを読む

カテゴリー: cs.CV, cs.LG | Diffusion Sampling Correction via Approximately 10 Parameters はコメントを受け付けていません

VPBSD:Vessel-Pattern-Based Semi-Supervised Distillation for Efficient 3D Microscopic Cerebrovascular Segmentation

要約 3D 顕微鏡脳血管画像はその高解像度が特徴であり、注釈付けに大きな課題があ … 続きを読む

カテゴリー: cs.CV | VPBSD:Vessel-Pattern-Based Semi-Supervised Distillation for Efficient 3D Microscopic Cerebrovascular Segmentation はコメントを受け付けていません

Dynamic Reconstruction of Hand-Object Interaction with Distributed Force-aware Contact Representation

要約 我々は、より正確な接触モデリングのために分散触覚センシングを統合した、動的 … 続きを読む

カテゴリー: cs.CV | Dynamic Reconstruction of Hand-Object Interaction with Distributed Force-aware Contact Representation はコメントを受け付けていません

V2A-Mark: Versatile Deep Visual-Audio Watermarking for Manipulation Localization and Copyright Protection

要約 AI によって生成されたビデオは、ショート ビデオ制作、映画製作、パーソナ … 続きを読む

カテゴリー: cs.CV | V2A-Mark: Versatile Deep Visual-Audio Watermarking for Manipulation Localization and Copyright Protection はコメントを受け付けていません

Spider: Any-to-Many Multimodal LLM

要約 マルチモーダル LLM (MLLM) は、大規模言語モデル (LLM) の … 続きを読む

カテゴリー: cs.CV | Spider: Any-to-Many Multimodal LLM はコメントを受け付けていません

SMILE-UHURA Challenge — Small Vessel Segmentation at Mesoscopic Scale from Ultra-High Resolution 7T Magnetic Resonance Angiograms

要約 人間の脳は、複雑な血管ネットワークを通じて栄養素と酸素を受け取ります。 メ … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | SMILE-UHURA Challenge — Small Vessel Segmentation at Mesoscopic Scale from Ultra-High Resolution 7T Magnetic Resonance Angiograms はコメントを受け付けていません

Stable Consistency Tuning: Understanding and Improving Consistency Models

要約 拡散モデルは優れた生成品質を実現しますが、ノイズ除去の反復的な性質により生 … 続きを読む

カテゴリー: cs.CV, cs.LG | Stable Consistency Tuning: Understanding and Improving Consistency Models はコメントを受け付けていません

LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models

要約 この研究では、テキストで事前トレーニングされた大規模言語モデル (LLM) … 続きを読む

カテゴリー: 68T05, cs.AI, cs.CL, cs.CV, cs.LG, I.2.10 | LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models はコメントを受け付けていません

Assessing the Performance of the DINOv2 Self-supervised Learning Vision Transformer Model for the Segmentation of the Left Atrium from MRI Images

要約 術前スキャンからの正確な左心房 (LA) セグメンテーションは、心房細動の … 続きを読む

カテゴリー: cs.CV, eess.IV | Assessing the Performance of the DINOv2 Self-supervised Learning Vision Transformer Model for the Segmentation of the Left Atrium from MRI Images はコメントを受け付けていません