cs.CV」カテゴリーアーカイブ

CIC: A Framework for Culturally-Aware Image Captioning

要約 画像キャプションは、BLIP などの視覚言語事前学習モデル (VLP) を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | CIC: A Framework for Culturally-Aware Image Captioning はコメントを受け付けていません

Enhancing predictive imaging biomarker discovery through treatment effect analysis

要約 個別の治療効果を予測する予測共変量を特定することは、個別化医療などのさまざ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | Enhancing predictive imaging biomarker discovery through treatment effect analysis はコメントを受け付けていません

Fundus Image-based Visual Acuity Assessment with PAC-Guarantees

要約 目の健康を維持するには、タイムリーな検出と治療が不可欠です。 遠くの視界の … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Fundus Image-based Visual Acuity Assessment with PAC-Guarantees はコメントを受け付けていません

Beyond Scalars: Concept-Based Alignment Analysis in Vision Transformers

要約 ビジョン トランスフォーマー (ViT) は、完全教師ありから自己教師あり … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Beyond Scalars: Concept-Based Alignment Analysis in Vision Transformers はコメントを受け付けていません

Detecting Facial Image Manipulations with Multi-Layer CNN Models

要約 デジタル画像操作技術の急速な進化は、安定した拡散やミッドジャーニーなどのモ … 続きを読む

カテゴリー: cs.AI, cs.CV | Detecting Facial Image Manipulations with Multi-Layer CNN Models はコメントを受け付けていません

Class Balance Matters to Active Class-Incremental Learning

要約 少数ショットのクラス増分学習は、限られた注釈を使用して新しい概念を効率的に … 続きを読む

カテゴリー: cs.CV | Class Balance Matters to Active Class-Incremental Learning はコメントを受け付けていません

The Narrow Gate: Localized Image-Text Communication in Vision-Language Models

要約 マルチモーダル トレーニングの最近の進歩により、統一モデル内での画像の理解 … 続きを読む

カテゴリー: cs.CV, cs.LG | The Narrow Gate: Localized Image-Text Communication in Vision-Language Models はコメントを受け付けていません

Object Detection using Event Camera: A MoE Heat Conduction based Detector and A New Benchmark Dataset

要約 イベント ストリームでの物体検出は最先端の研究分野として浮上しており、低照 … 続きを読む

カテゴリー: cs.CV, cs.NE | Object Detection using Event Camera: A MoE Heat Conduction based Detector and A New Benchmark Dataset はコメントを受け付けていません

Instructional Video Generation

要約 最近のビデオ生成の進歩にも関わらず、最先端の手法では依然として視覚的な詳細 … 続きを読む

カテゴリー: cs.CV | Instructional Video Generation はコメントを受け付けていません

Break a Lag: Triple Exponential Moving Average for Enhanced Optimization

要約 深層学習モデルのパフォーマンスは、高度な最適化戦略に大きく依存します。 既 … 続きを読む

カテゴリー: cs.CV, cs.LG | Break a Lag: Triple Exponential Moving Average for Enhanced Optimization はコメントを受け付けていません