cs.CV」カテゴリーアーカイブ

OmniGen: Unified Image Generation

要約 この研究では、統合画像生成のための新しい普及モデルである OmniGen … 続きを読む

カテゴリー: cs.AI, cs.CV | OmniGen: Unified Image Generation はコメントを受け付けていません

Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think

要約 最近の研究では、画像条件付き画像生成タスクとして深度推定をキャストすること … 続きを読む

カテゴリー: cs.CV | Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think はコメントを受け付けていません

RenderWorld: World Model with Self-Supervised 3D Label

要約 ビジョンのみによるエンドツーエンドの自動運転は、LiDAR とビジョンの融 … 続きを読む

カテゴリー: cs.AI, cs.CV | RenderWorld: World Model with Self-Supervised 3D Label はコメントを受け付けていません

SpatialBot: Precise Spatial Understanding with Vision Language Models

要約 ビジョン言語モデル (VLM) は、2D 画像理解において目覚ましいパフォ … 続きを読む

カテゴリー: cs.CV | SpatialBot: Precise Spatial Understanding with Vision Language Models はコメントを受け付けていません

OSV: One Step is Enough for High-Quality Image to Video Generation

要約 ビデオ普及モデルは、高品質のビデオを生成する上で大きな可能性を示しており、 … 続きを読む

カテゴリー: cs.CV | OSV: One Step is Enough for High-Quality Image to Video Generation はコメントを受け付けていません

Compact Implicit Neural Representations for Plane Wave Images

要約 超高速平面波 (PW) イメージングでは、照射角度によって変化するアーチフ … 続きを読む

カテゴリー: cs.CV, eess.IV | Compact Implicit Neural Representations for Plane Wave Images はコメントを受け付けていません

Uncertainty and Prediction Quality Estimation for Semantic Segmentation via Graph Neural Networks

要約 自動車の認識や医療画像などの安全性が重要なアプリケーションでセマンティック … 続きを読む

カテゴリー: 68T07, cs.CV | Uncertainty and Prediction Quality Estimation for Semantic Segmentation via Graph Neural Networks はコメントを受け付けていません

Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification

要約 医療分野では、プライバシー上の懸念により、大規模なデータセットを取得するこ … 続きを読む

カテゴリー: cs.AI, cs.CV | Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification はコメントを受け付けていません

Ultrasound Image Enhancement with the Variance of Diffusion Models

要約 超音波イメージングは​​、医療で広く使用されているにもかかわらず、信号対雑 … 続きを読む

カテゴリー: cs.CV | Ultrasound Image Enhancement with the Variance of Diffusion Models はコメントを受け付けていません

S$^3$Attention: Improving Long Sequence Attention with Smoothed Skeleton Sketching

要約 アテンションベースのモデルは、数多くのアプリケーションで多くの目覚ましい進 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, stat.ML | S$^3$Attention: Improving Long Sequence Attention with Smoothed Skeleton Sketching はコメントを受け付けていません