cs.CV」カテゴリーアーカイブ

Explaining the Impact of Training on Vision Models via Activation Clustering

要約 Visionモデル向けの説明可能な人工知能(XAI)の分野での最近の開発は … 続きを読む

カテゴリー: cs.CV, cs.LG | Explaining the Impact of Training on Vision Models via Activation Clustering はコメントを受け付けていません

Image compositing is all you need for data augmentation

要約 このペーパーでは、オブジェクト検出モデルのパフォーマンスに対するさまざまな … 続きを読む

カテゴリー: cs.CV, cs.LG | Image compositing is all you need for data augmentation はコメントを受け付けていません

A Chain-of-Thought Subspace Meta-Learning for Few-shot Image Captioning with Large Vision and Language Models

要約 大規模なデータで事前に処理されている大規模なビジョンと言語モデルは、視覚的 … 続きを読む

カテゴリー: cs.CV | A Chain-of-Thought Subspace Meta-Learning for Few-shot Image Captioning with Large Vision and Language Models はコメントを受け付けていません

Carefully Blending Adversarial Training, Purification, and Aggregation Improves Adversarial Robustness

要約 この作業では、イメージ分類のための新しい敵対的な防御メカニズム &#821 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG | Carefully Blending Adversarial Training, Purification, and Aggregation Improves Adversarial Robustness はコメントを受け付けていません

GPU-Friendly Laplacian Texture Blending

要約 テクスチャと材料ブレンドは、レンダリングされた仮想世界に多様性を追加し、複 … 続きを読む

カテゴリー: cs.CV, cs.GR | GPU-Friendly Laplacian Texture Blending はコメントを受け付けていません

High-Quality 3D Creation from A Single Image Using Subject-Specific Knowledge Prior

要約 この論文では、単一の画像から高品質の3Dモデルを生成するための新しい2段階 … 続きを読む

カテゴリー: cs.AI, cs.CV | High-Quality 3D Creation from A Single Image Using Subject-Specific Knowledge Prior はコメントを受け付けていません

IP-Composer: Semantic Composition of Visual Concepts

要約 コンテンツクリエーターは、多くの場合、複数の視覚ソースからインスピレーショ … 続きを読む

カテゴリー: cs.CV, cs.GR | IP-Composer: Semantic Composition of Visual Concepts はコメントを受け付けていません

IM360: Textured Mesh Reconstruction for Large-scale Indoor Mapping with 360$^\circ$ Cameras

要約 屋内環境の3Dマッピングとレンダリング用の360 $^\ circ $カメ … 続きを読む

カテゴリー: cs.CV | IM360: Textured Mesh Reconstruction for Large-scale Indoor Mapping with 360$^\circ$ Cameras はコメントを受け付けていません

A Training-Free Framework for Precise Mobile Manipulation of Small Everyday Objects

要約 毎日のモバイル操作タスクの多くは、ノブをつかんでキャビネットを開いたり、ラ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | A Training-Free Framework for Precise Mobile Manipulation of Small Everyday Objects はコメントを受け付けていません

FlexTok: Resampling Images into 1D Token Sequences of Flexible Length

要約 画像トークン化により、生のピクセルよりも処理するのが効率的な圧縮された離散 … 続きを読む

カテゴリー: cs.CV, cs.LG | FlexTok: Resampling Images into 1D Token Sequences of Flexible Length はコメントを受け付けていません