月別アーカイブ: 2024年9月

RenderWorld: World Model with Self-Supervised 3D Label

要約 ビジョンのみによるエンドツーエンドの自動運転は、LiDAR とビジョンの融 … 続きを読む

カテゴリー: cs.AI, cs.CV | RenderWorld: World Model with Self-Supervised 3D Label はコメントを受け付けていません

SpatialBot: Precise Spatial Understanding with Vision Language Models

要約 ビジョン言語モデル (VLM) は、2D 画像理解において目覚ましいパフォ … 続きを読む

カテゴリー: cs.CV | SpatialBot: Precise Spatial Understanding with Vision Language Models はコメントを受け付けていません

OSV: One Step is Enough for High-Quality Image to Video Generation

要約 ビデオ普及モデルは、高品質のビデオを生成する上で大きな可能性を示しており、 … 続きを読む

カテゴリー: cs.CV | OSV: One Step is Enough for High-Quality Image to Video Generation はコメントを受け付けていません

Compact Implicit Neural Representations for Plane Wave Images

要約 超高速平面波 (PW) イメージングでは、照射角度によって変化するアーチフ … 続きを読む

カテゴリー: cs.CV, eess.IV | Compact Implicit Neural Representations for Plane Wave Images はコメントを受け付けていません

Uncertainty and Prediction Quality Estimation for Semantic Segmentation via Graph Neural Networks

要約 自動車の認識や医療画像などの安全性が重要なアプリケーションでセマンティック … 続きを読む

カテゴリー: 68T07, cs.CV | Uncertainty and Prediction Quality Estimation for Semantic Segmentation via Graph Neural Networks はコメントを受け付けていません

Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification

要約 医療分野では、プライバシー上の懸念により、大規模なデータセットを取得するこ … 続きを読む

カテゴリー: cs.AI, cs.CV | Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification はコメントを受け付けていません

Ultrasound Image Enhancement with the Variance of Diffusion Models

要約 超音波イメージングは​​、医療で広く使用されているにもかかわらず、信号対雑 … 続きを読む

カテゴリー: cs.CV | Ultrasound Image Enhancement with the Variance of Diffusion Models はコメントを受け付けていません

S$^3$Attention: Improving Long Sequence Attention with Smoothed Skeleton Sketching

要約 アテンションベースのモデルは、数多くのアプリケーションで多くの目覚ましい進 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, stat.ML | S$^3$Attention: Improving Long Sequence Attention with Smoothed Skeleton Sketching はコメントを受け付けていません

Training Datasets Generation for Machine Learning: Application to Vision Based Navigation

要約 ビジョンベースナビゲーションは、画像から情報を抽出した後、カメラを GNC … 続きを読む

カテゴリー: astro-ph.EP, cs.CV, cs.GR, cs.LG | Training Datasets Generation for Machine Learning: Application to Vision Based Navigation はコメントを受け付けていません

NVLM: Open Frontier-Class Multimodal LLMs

要約 NVLM 1.0 は、視覚言語タスクで最先端の結果を達成するフロンティアク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | NVLM: Open Frontier-Class Multimodal LLMs はコメントを受け付けていません