「cs.CV」カテゴリーアーカイブ

CIC: A Framework for Culturally-Aware Image Captioning

投稿日: 2024年12月10日作成者: jarxiv

要約画像キャプションは、BLIP などの視覚言語事前学習モデル (VLP) を … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Enhancing predictive imaging biomarker discovery through treatment effect analysis

投稿日: 2024年12月10日作成者: jarxiv

要約個別の治療効果を予測する予測共変量を特定することは、個別化医療などのさまざ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | コメントを受け付けていません

Fundus Image-based Visual Acuity Assessment with PAC-Guarantees

投稿日: 2024年12月10日作成者: jarxiv

要約目の健康を維持するには、タイムリーな検出と治療が不可欠です。遠くの視界の … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

Beyond Scalars: Concept-Based Alignment Analysis in Vision Transformers

投稿日: 2024年12月10日作成者: jarxiv

要約ビジョントランスフォーマー (ViT) は、完全教師ありから自己教師あり … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Detecting Facial Image Manipulations with Multi-Layer CNN Models

投稿日: 2024年12月10日作成者: jarxiv

要約デジタル画像操作技術の急速な進化は、安定した拡散やミッドジャーニーなどのモ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Class Balance Matters to Active Class-Incremental Learning

投稿日: 2024年12月10日作成者: jarxiv

要約少数ショットのクラス増分学習は、限られた注釈を使用して新しい概念を効率的に … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

The Narrow Gate: Localized Image-Text Communication in Vision-Language Models

投稿日: 2024年12月10日作成者: jarxiv

要約マルチモーダルトレーニングの最近の進歩により、統一モデル内での画像の理解 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Object Detection using Event Camera: A MoE Heat Conduction based Detector and A New Benchmark Dataset

投稿日: 2024年12月10日作成者: jarxiv

要約イベントストリームでの物体検出は最先端の研究分野として浮上しており、低照 … 続きを読む →

カテゴリー: cs.CV, cs.NE | コメントを受け付けていません

Instructional Video Generation

投稿日: 2024年12月10日作成者: jarxiv

要約最近のビデオ生成の進歩にも関わらず、最先端の手法では依然として視覚的な詳細 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Break a Lag: Triple Exponential Moving Average for Enhanced Optimization

投稿日: 2024年12月10日作成者: jarxiv

要約深層学習モデルのパフォーマンスは、高度な最適化戦略に大きく依存します。既 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

CIC: A Framework for Culturally-Aware Image Captioning

Enhancing predictive imaging biomarker discovery through treatment effect analysis

Fundus Image-based Visual Acuity Assessment with PAC-Guarantees

Beyond Scalars: Concept-Based Alignment Analysis in Vision Transformers

Detecting Facial Image Manipulations with Multi-Layer CNN Models

Class Balance Matters to Active Class-Incremental Learning

The Narrow Gate: Localized Image-Text Communication in Vision-Language Models

Object Detection using Event Camera: A MoE Heat Conduction based Detector and A New Benchmark Dataset

Instructional Video Generation

Break a Lag: Triple Exponential Moving Average for Enhanced Optimization

最近の投稿

最近のコメント

アーカイブ

カテゴリー