cs.CV」カテゴリーアーカイブ

MetricGold: Leveraging Text-To-Image Latent Diffusion Models for Metric Depth Estimation

要約 単一の画像からメトリック深度を回復することは、コンピューター ビジョンにお … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO | MetricGold: Leveraging Text-To-Image Latent Diffusion Models for Metric Depth Estimation はコメントを受け付けていません

Calib3D: Calibrating Model Preferences for Reliable 3D Scene Understanding

要約 安全性が重要な 3D シーン理解タスクでは、3D 認識モデルからの正確な予 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Calib3D: Calibrating Model Preferences for Reliable 3D Scene Understanding はコメントを受け付けていません

Reinforcement Learning from Wild Animal Videos

要約 私たちは、自然ドキュメンタリーで特集されているものなど、インターネットから … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Reinforcement Learning from Wild Animal Videos はコメントを受け付けていません

Structure-Aware Stylized Image Synthesis for Robust Medical Image Segmentation

要約 正確な医療画像のセグメンテーションは、効果的な診断と治療計画に不可欠ですが … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Structure-Aware Stylized Image Synthesis for Robust Medical Image Segmentation はコメントを受け付けていません

The Tile: A 2D Map of Ranking Scores for Two-Class Classification

要約 コンピューター ビジョンと機械学習のコミュニティだけでなく、他の多くの研究 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.PF | The Tile: A 2D Map of Ranking Scores for Two-Class Classification はコメントを受け付けていません

Generative-Model-Based Fully 3D PET Image Reconstruction by Conditional Diffusion Sampling

要約 スコアベース生成モデル (SGM) は最近、シミュレートされた陽電子放射断 … 続きを読む

カテゴリー: cs.CV, cs.LG, physics.med-ph | Generative-Model-Based Fully 3D PET Image Reconstruction by Conditional Diffusion Sampling はコメントを受け付けていません

Likelihood-Scheduled Score-Based Generative Modeling for Fully 3D PET Image Reconstruction

要約 事前トレーニング済みのスコアベース生成モデル (SGM) を使用した医療画 … 続きを読む

カテゴリー: cs.CV, cs.LG, physics.med-ph | Likelihood-Scheduled Score-Based Generative Modeling for Fully 3D PET Image Reconstruction はコメントを受け付けていません

Words in Motion: Extracting Interpretable Control Vectors for Motion Transformers

要約 トランスフォーマーベースのモデルは、解釈が難しい隠れた状態を生成します。 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Words in Motion: Extracting Interpretable Control Vectors for Motion Transformers はコメントを受け付けていません

Text Change Detection in Multilingual Documents Using Image Comparison

要約 文書比較は通常、そのコア技術として光学式文字認識 (OCR) に依存します … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Text Change Detection in Multilingual Documents Using Image Comparison はコメントを受け付けていません

Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models

要約 現在の最も先進的なビジョン言語モデル (VLM) は、依然として独自仕様で … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models はコメントを受け付けていません