cs.CV」カテゴリーアーカイブ

Unraveling Cross-Modality Knowledge Conflicts in Large Vision-Language Models

要約 Large Vision-Language Model (LVLM) は、 … 続きを読む

カテゴリー: cs.CL, cs.CV | Unraveling Cross-Modality Knowledge Conflicts in Large Vision-Language Models はコメントを受け付けていません

Bridge the Points: Graph-based Few-shot Segment Anything Semantically

要約 大規模な事前トレーニング技術の最近の進歩により、ビジョン基盤モデル、特にポ … 続きを読む

カテゴリー: cs.CV | Bridge the Points: Graph-based Few-shot Segment Anything Semantically はコメントを受け付けていません

Calibrated Cache Model for Few-Shot Vision-Language Model Adaptation

要約 キャッシュベースのアプローチは、ビジョン言語モデル (VLM) を適応させ … 続きを読む

カテゴリー: cs.CV | Calibrated Cache Model for Few-Shot Vision-Language Model Adaptation はコメントを受け付けていません

LoTLIP: Improving Language-Image Pre-training for Long Text Understanding

要約 長いテキストを理解することは実際には大きな要求ですが、ほとんどの言語画像事 … 続きを読む

カテゴリー: cs.CV | LoTLIP: Improving Language-Image Pre-training for Long Text Understanding はコメントを受け付けていません

Efficient Hyperparameter Importance Assessment for CNNs

要約 ハイパーパラメータの選択は機械学習パイプラインの重要な側面であり、モデルの … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Efficient Hyperparameter Importance Assessment for CNNs はコメントを受け付けていません

Accurately Classifying Out-Of-Distribution Data in Facial Recognition

要約 標準的な分類理論では、テスト セットとトレーニング セット内の画像の分布が … 続きを読む

カテゴリー: cs.CV, cs.CY, cs.LG | Accurately Classifying Out-Of-Distribution Data in Facial Recognition はコメントを受け付けていません

HyperPg — Prototypical Gaussians on the Hypersphere for Interpretable Deep Learning

要約 プロトタイプ学習手法は、ブラックボックスの深層学習モデルに代わる解釈可能な … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | HyperPg — Prototypical Gaussians on the Hypersphere for Interpretable Deep Learning はコメントを受け付けていません

Zero-Shot Pupil Segmentation with SAM 2: A Case Study of Over 14 Million Images

要約 私たちは、視線推定および視線追跡技術の進歩における、視覚基盤モデルである … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC | Zero-Shot Pupil Segmentation with SAM 2: A Case Study of Over 14 Million Images はコメントを受け付けていません

For a semiotic AI: Bridging computer vision and visual semiotics for computational observation of large scale facial image archives

要約 ソーシャル ネットワークは、人間の顔や体の画像の認知的、感情的、実用的な価 … 続きを読む

カテゴリー: cs.CV | For a semiotic AI: Bridging computer vision and visual semiotics for computational observation of large scale facial image archives はコメントを受け付けていません

Match me if you can: Semi-Supervised Semantic Correspondence Learning with Unpaired Images

要約 セマンティック対応方法は、モデルの能力を最大化することを目的として、複雑な … 続きを読む

カテゴリー: cs.CV, cs.LG | Match me if you can: Semi-Supervised Semantic Correspondence Learning with Unpaired Images はコメントを受け付けていません