cs.CV」カテゴリーアーカイブ

Captured by Captions: On Memorization and its Mitigation in CLIP Models

要約 クリップなどのマルチモーダルモデルは、画像検索やゼロショット分類などのタス … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Captured by Captions: On Memorization and its Mitigation in CLIP Models はコメントを受け付けていません

JetFormer: An Autoregressive Generative Model of Raw Images and Text

要約 モデリングの制約を削除し、ドメイン全体でアーキテクチャを統合することは、大 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | JetFormer: An Autoregressive Generative Model of Raw Images and Text はコメントを受け付けていません

FIOVA: A Multi-Annotator Benchmark for Human-Aligned Video Captioning

要約 大きなビジョン言語モデル(LVLMS)の急速な進歩にもかかわらず、既存のビ … 続きを読む

カテゴリー: cs.CV | FIOVA: A Multi-Annotator Benchmark for Human-Aligned Video Captioning はコメントを受け付けていません

Joint Depth and Reflectivity Estimation using Single-Photon LiDAR

要約 単一光子光の検出と範囲(SPライダーは、長距離、高精度の3D視力タスクの主 … 続きを読む

カテゴリー: cs.CV | Joint Depth and Reflectivity Estimation using Single-Photon LiDAR はコメントを受け付けていません

Anomaly Anything: Promptable Unseen Visual Anomaly Generation

要約 視覚異常検出(AD)は、異常なデータサンプルの希少性のために重要な課題を提 … 続きを読む

カテゴリー: cs.CV | Anomaly Anything: Promptable Unseen Visual Anomaly Generation はコメントを受け付けていません

Unlocking the Potential of Difficulty Prior in RL-based Multimodal Reasoning

要約 この作業では、問題の困難の事前情報を明示的にモデル化することで、マルチモー … 続きを読む

カテゴリー: cs.CV | Unlocking the Potential of Difficulty Prior in RL-based Multimodal Reasoning はコメントを受け付けていません

DB3D-L: Depth-aware BEV Feature Transformation for Accurate 3D Lane Detection

要約 3Dレーン検出は、自律運転において重要な役割を果たします。 最近の進歩は、 … 続きを読む

カテゴリー: cs.CV | DB3D-L: Depth-aware BEV Feature Transformation for Accurate 3D Lane Detection はコメントを受け付けていません

Quantifying Context Bias in Domain Adaptation for Object Detection

要約 オブジェクト検出のためのドメイン適応(DAOD)は、訓練されたモデルをソー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Quantifying Context Bias in Domain Adaptation for Object Detection はコメントを受け付けていません

Event-Driven Dynamic Scene Depth Completion

要約 ダイナミックシーンの深さの完了は、RGB画像やLIDAR測定などの入力モダ … 続きを読む

カテゴリー: cs.CV | Event-Driven Dynamic Scene Depth Completion はコメントを受け付けていません

Computer Vision Models Show Human-Like Sensitivity to Geometric and Topological Concepts

要約 機械学習(ML)モデルの急速な改善により、認知科学者は人間の考え方との整合 … 続きを読む

カテゴリー: cs.CV | Computer Vision Models Show Human-Like Sensitivity to Geometric and Topological Concepts はコメントを受け付けていません