月別アーカイブ: 2025年6月

Balancing Beyond Discrete Categories: Continuous Demographic Labels for Fair Face Recognition

要約 バイアスは、顔認識モデルで一定のものでした。 長年にわたり、研究者はモデル … 続きを読む

カテゴリー: cs.CV | コメントする

CLaMR: Contextualized Late-Interaction for Multimodal Content Retrieval

要約 オンラインビデオWebコンテンツは豊富にマルチモーダルです。単一のビデオは … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.IR | コメントする

ARMOR: Empowering Multimodal Understanding Model with Interleaved Multimodal Generation Capability

要約 統一されたマルチモーダルの理解と世代は最近、ビジョンと言語の分野で多くの注 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

A Novel Large-scale Crop Dataset and Dual-stream Transformer Method for Fine-grained Hierarchical Crop Classification from Integrated Hyperspectral EnMAP Data and Multispectral Sentinel-2 Time Series

要約 精密な農業と食料安全保障の監視には、細粒の作物分類が重要です。 フェノロジ … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

In Search of Forgotten Domain Generalization

要約 ドメイン外(OOD)一般化は、1つ以上のドメインで訓練されたモデルの能力が … 続きを読む

カテゴリー: cs.CV | コメントする

Technical Report for Egocentric Mistake Detection for the HoloAssist Challenge

要約 このレポートでは、産業の自動化や教育などのドメインで不可欠なオンラインミス … 続きを読む

カテゴリー: cs.CV | コメントする

SatelliteFormula: Multi-Modal Symbolic Regression from Remote Sensing Imagery for Physics Discovery

要約 マルチスペクトルのリモートセンシング画像から物理的に解釈可能な表現を直接導 … 続きを読む

カテゴリー: cs.CV | コメントする

From Prototypes to General Distributions: An Efficient Curriculum for Masked Image Modeling

要約 Masked Image Modeling(MIM)は、視覚表現学習のため … 続きを読む

カテゴリー: cs.CV | コメントする

SemiOccam: A Robust Semi-Supervised Image Recognition Network Using Sparse Labels

要約 Semioccamは、非常に効率的な方法で半学習学習を活用する画像認識ネッ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする

3DFlowAction: Learning Cross-Embodiment Manipulation from 3D Flow World Model

要約 操作は長い間ロボットにとって挑戦的な作業でしたが、人間はマグカップラックに … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする