cs.CV」カテゴリーアーカイブ

Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification

要約 医療分野では、プライバシー上の懸念により、大規模なデータセットを取得するこ … 続きを読む

カテゴリー: cs.AI, cs.CV | Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification はコメントを受け付けていません

Ultrasound Image Enhancement with the Variance of Diffusion Models

要約 超音波イメージングは​​、医療で広く使用されているにもかかわらず、信号対雑 … 続きを読む

カテゴリー: cs.CV | Ultrasound Image Enhancement with the Variance of Diffusion Models はコメントを受け付けていません

S$^3$Attention: Improving Long Sequence Attention with Smoothed Skeleton Sketching

要約 アテンションベースのモデルは、数多くのアプリケーションで多くの目覚ましい進 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, stat.ML | S$^3$Attention: Improving Long Sequence Attention with Smoothed Skeleton Sketching はコメントを受け付けていません

Training Datasets Generation for Machine Learning: Application to Vision Based Navigation

要約 ビジョンベースナビゲーションは、画像から情報を抽出した後、カメラを GNC … 続きを読む

カテゴリー: astro-ph.EP, cs.CV, cs.GR, cs.LG | Training Datasets Generation for Machine Learning: Application to Vision Based Navigation はコメントを受け付けていません

NVLM: Open Frontier-Class Multimodal LLMs

要約 NVLM 1.0 は、視覚言語タスクで最先端の結果を達成するフロンティアク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | NVLM: Open Frontier-Class Multimodal LLMs はコメントを受け付けていません

Phidias: A Generative Model for Creating 3D Content from Text, Image, and 3D Conditions with Reference-Augmented Diffusion

要約 3D モデリングでは、デザイナーは既存の 3D モデルを参照として使用して … 続きを読む

カテゴリー: cs.CV | Phidias: A Generative Model for Creating 3D Content from Text, Image, and 3D Conditions with Reference-Augmented Diffusion はコメントを受け付けていません

Fuse4Seg: Image-Level Fusion Based Multi-Modality Medical Image Segmentation

要約 マルチモダリティ医療画像セグメンテーションは、多様な画像モダリティを統合す … 続きを読む

カテゴリー: cs.CV | Fuse4Seg: Image-Level Fusion Based Multi-Modality Medical Image Segmentation はコメントを受け付けていません

NGD-SLAM: Towards Real-Time Dynamic SLAM without GPU

要約 既存の SLAM (Simultaneous Localization a … 続きを読む

カテゴリー: cs.CV, cs.RO | NGD-SLAM: Towards Real-Time Dynamic SLAM without GPU はコメントを受け付けていません

P2U-SLAM: A Monocular Wide-FoV SLAM System Based on Point Uncertainty and Pose Uncertainty

要約 この論文では、位置不確実性と点不確実性を利用する、広視野 (FoV) カメ … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | P2U-SLAM: A Monocular Wide-FoV SLAM System Based on Point Uncertainty and Pose Uncertainty はコメントを受け付けていません

SplatSim: Zero-Shot Sim2Real Transfer of RGB Manipulation Policies Using Gaussian Splatting

要約 Sim2Real の転送、特に RGB 画像に依存する操作ポリシーの場合、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | SplatSim: Zero-Shot Sim2Real Transfer of RGB Manipulation Policies Using Gaussian Splatting はコメントを受け付けていません