月別アーカイブ: 2025年2月

Personalized Instance-based Navigation Toward User-Specific Objects in Realistic Environments

要約 過去数年間、屋内環境のオブジェクトへの視覚的ナビゲーションへの研究の関心は … 続きを読む

カテゴリー: cs.CV, cs.RO | Personalized Instance-based Navigation Toward User-Specific Objects in Realistic Environments はコメントを受け付けていません

GroundCap: A Visually Grounded Image Captioning Dataset

要約 現在の画像キャプションシステムには、説明テキストを特定の視覚要素にリンクす … 続きを読む

カテゴリー: cs.CL, cs.CV, I.2.10 | GroundCap: A Visually Grounded Image Captioning Dataset はコメントを受け付けていません

Qwen2.5-VL Technical Report

要約 QWEN Vision-Languageシリーズの最新のフラッグシップモデ … 続きを読む

カテゴリー: cs.CL, cs.CV | Qwen2.5-VL Technical Report はコメントを受け付けていません

Symmetrical Visual Contrastive Optimization: Aligning Vision-Language Models with Minimal Contrastive Images

要約 最近の研究では、大きなビジョン言語モデル(VLM)が画像コンテンツを無視し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Symmetrical Visual Contrastive Optimization: Aligning Vision-Language Models with Minimal Contrastive Images はコメントを受け付けていません

Continually Learning Structured Visual Representations via Network Refinement with Rerelation

要約 現在の機械学習のパラダイムは、問題の構造を直接学習するのではなく、アウトカ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Continually Learning Structured Visual Representations via Network Refinement with Rerelation はコメントを受け付けていません

Explaining the Impact of Training on Vision Models via Activation Clustering

要約 Visionモデル向けの説明可能な人工知能(XAI)の分野での最近の開発は … 続きを読む

カテゴリー: cs.CV, cs.LG | Explaining the Impact of Training on Vision Models via Activation Clustering はコメントを受け付けていません

Image compositing is all you need for data augmentation

要約 このペーパーでは、オブジェクト検出モデルのパフォーマンスに対するさまざまな … 続きを読む

カテゴリー: cs.CV, cs.LG | Image compositing is all you need for data augmentation はコメントを受け付けていません

A Chain-of-Thought Subspace Meta-Learning for Few-shot Image Captioning with Large Vision and Language Models

要約 大規模なデータで事前に処理されている大規模なビジョンと言語モデルは、視覚的 … 続きを読む

カテゴリー: cs.CV | A Chain-of-Thought Subspace Meta-Learning for Few-shot Image Captioning with Large Vision and Language Models はコメントを受け付けていません

Carefully Blending Adversarial Training, Purification, and Aggregation Improves Adversarial Robustness

要約 この作業では、イメージ分類のための新しい敵対的な防御メカニズム &#821 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG | Carefully Blending Adversarial Training, Purification, and Aggregation Improves Adversarial Robustness はコメントを受け付けていません

GPU-Friendly Laplacian Texture Blending

要約 テクスチャと材料ブレンドは、レンダリングされた仮想世界に多様性を追加し、複 … 続きを読む

カテゴリー: cs.CV, cs.GR | GPU-Friendly Laplacian Texture Blending はコメントを受け付けていません