cs.CV」カテゴリーアーカイブ

Resolution-Robust 3D MRI Reconstruction with 2D Diffusion Priors: Diverse-Resolution Training Outperforms Interpolation

要約 ディープラーニングベースの 3D イメージング、特に磁気共鳴イメージング … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Resolution-Robust 3D MRI Reconstruction with 2D Diffusion Priors: Diverse-Resolution Training Outperforms Interpolation はコメントを受け付けていません

Refining CNN-based Heatmap Regression with Gradient-based Corner Points for Electrode Localization

要約 リチウムイオン電池の電極位置を検出する手法を提案します。 このプロセスは、 … 続きを読む

カテゴリー: cs.CV | Refining CNN-based Heatmap Regression with Gradient-based Corner Points for Electrode Localization はコメントを受け付けていません

Text-Driven Tumor Synthesis

要約 腫瘍合成は、AI が見逃したり過剰検出したりする例を生成し、これらの困難な … 続きを読む

カテゴリー: cs.CV, eess.IV | Text-Driven Tumor Synthesis はコメントを受け付けていません

ClassifyViStA:WCE Classification with Visual understanding through Segmentation and Attention

要約 胃腸 (GI) 出血は、特に医療リソースへのアクセスが限られている環境では … 続きを読む

カテゴリー: cs.CV | ClassifyViStA:WCE Classification with Visual understanding through Segmentation and Attention はコメントを受け付けていません

LatentCRF: Continuous CRF for Efficient Latent Diffusion

要約 潜在拡散モデル (LDM) は、高品質でフォトリアリスティックな画像を生成 … 続きを読む

カテゴリー: cs.CV | LatentCRF: Continuous CRF for Efficient Latent Diffusion はコメントを受け付けていません

DiTCtrl: Exploring Attention Control in Multi-Modal Diffusion Transformer for Tuning-Free Multi-Prompt Longer Video Generation

要約 Sora のようなビデオ生成モデルは、マルチモーダル拡散トランス MM-D … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | DiTCtrl: Exploring Attention Control in Multi-Modal Diffusion Transformer for Tuning-Free Multi-Prompt Longer Video Generation はコメントを受け付けていません

ZeroHSI: Zero-Shot 4D Human-Scene Interaction by Video Generation

要約 ヒューマンシーン インタラクション (HSI) の生成は、具体化された A … 続きを読む

カテゴリー: cs.CV, cs.GR | ZeroHSI: Zero-Shot 4D Human-Scene Interaction by Video Generation はコメントを受け付けていません

Explaining in Diffusion: Explaining a Classifier Through Hierarchical Semantics with Text-to-Image Diffusion Models

要約 分類子は、多くのコンピューター ビジョン タスクにおいて重要なコンポーネン … 続きを読む

カテゴリー: cs.CV | Explaining in Diffusion: Explaining a Classifier Through Hierarchical Semantics with Text-to-Image Diffusion Models はコメントを受け付けていません

Orient Anything: Learning Robust Object Orientation Estimation from Rendering 3D Models

要約 方向はオブジェクトの重要な属性であり、画像内のオブジェクトの空間的な姿勢や … 続きを読む

カテゴリー: cs.CV | Orient Anything: Learning Robust Object Orientation Estimation from Rendering 3D Models はコメントを受け付けていません

DrivingGPT: Unifying Driving World Modeling and Planning with Multi-modal Autoregressive Transformers

要約 世界モデルに基づく探索と計画は、人間レベルの身体的知性への有望な道として広 … 続きを読む

カテゴリー: cs.CV | DrivingGPT: Unifying Driving World Modeling and Planning with Multi-modal Autoregressive Transformers はコメントを受け付けていません