月別アーカイブ: 2025年3月

UniHOPE: A Unified Approach for Hand-Only and Hand-Object Pose Estimation

要約 単眼画像からの3Dハンドのポーズと潜在的な手持ちのオブジェクトを推定するこ … 続きを読む

カテゴリー: cs.CV | UniHOPE: A Unified Approach for Hand-Only and Hand-Object Pose Estimation はコメントを受け付けていません

Integrating AI for Human-Centric Breast Cancer Diagnostics: A Multi-Scale and Multi-View Swin Transformer Framework

要約 コンピューター支援診断(CAD)システムの進歩にもかかわらず、乳がんは世界 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Integrating AI for Human-Centric Breast Cancer Diagnostics: A Multi-Scale and Multi-View Swin Transformer Framework はコメントを受け付けていません

Classifier-Free Guidance inside the Attraction Basin May Cause Memorization

要約 拡散モデルは、トレーニングデータから画像を正確に再現する傾向があります。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Classifier-Free Guidance inside the Attraction Basin May Cause Memorization はコメントを受け付けていません

Revisiting Text-to-Image Evaluation with Gecko: On Metrics, Prompts, and Human Ratings

要約 テキストからイメージ(T2I)生成モデルはユビキタスになっていますが、特定 … 続きを読む

カテゴリー: cs.CV | Revisiting Text-to-Image Evaluation with Gecko: On Metrics, Prompts, and Human Ratings はコメントを受け付けていません

MagicDistillation: Weak-to-Strong Video Distillation for Large-Scale Portrait Few-Step Synthesis

要約 ポートレートビデオ統合タスクのための微調整オープンソースの大規模VDMは、 … 続きを読む

カテゴリー: cs.CV | MagicDistillation: Weak-to-Strong Video Distillation for Large-Scale Portrait Few-Step Synthesis はコメントを受け付けていません

Edit Transfer: Learning Image Editing via Vision In-Context Relations

要約 新しい設定を紹介し、転送を編集します。ここでは、モデルが単一のソースターゲ … 続きを読む

カテゴリー: cs.CV | Edit Transfer: Learning Image Editing via Vision In-Context Relations はコメントを受け付けていません

Nullu: Mitigating Object Hallucinations in Large Vision-Language Models via HalluSpace Projection

要約 最近の研究では、大きな視覚言語モデル(LVLM)がしばしばオブジェクトの幻 … 続きを読む

カテゴリー: cs.CV | Nullu: Mitigating Object Hallucinations in Large Vision-Language Models via HalluSpace Projection はコメントを受け付けていません

LEAVS: An LLM-based Labeler for Abdominal CT Supervision

要約 放射線レポートから構造化されたラベルの抽出が採用されており、視力モデルを作 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | LEAVS: An LLM-based Labeler for Abdominal CT Supervision はコメントを受け付けていません

STEP: Simultaneous Tracking and Estimation of Pose for Animals and Humans

要約 私たちは、多様な動物種や人間にわたるポーズの同時追跡と推定のために、変圧器 … 続きを読む

カテゴリー: cs.CV | STEP: Simultaneous Tracking and Estimation of Pose for Animals and Humans はコメントを受け付けていません

Spatio-Temporal Distortion Aware Omnidirectional Video Super-Resolution

要約 全方向性ビデオ(ODV)は没入型の視覚体験を提供し、仮想現実と拡張現実で広 … 続きを読む

カテゴリー: cs.CV | Spatio-Temporal Distortion Aware Omnidirectional Video Super-Resolution はコメントを受け付けていません