cs.AI」カテゴリーアーカイブ

Automatic Data Curation for Self-Supervised Learning: A Clustering-Based Approach

要約 自己教師あり機能は、最新の機械学習システムの基礎です。 通常、データ収集に … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Automatic Data Curation for Self-Supervised Learning: A Clustering-Based Approach はコメントを受け付けていません

Less is more: Summarizing Patch Tokens for efficient Multi-Label Class-Incremental Learning

要約 プロンプト チューニングは、タスク固有のパラメータ (またはプロンプト) … 続きを読む

カテゴリー: cs.AI, cs.CV | Less is more: Summarizing Patch Tokens for efficient Multi-Label Class-Incremental Learning はコメントを受け付けていません

HDC: Hierarchical Semantic Decoding with Counting Assistance for Generalized Referring Expression Segmentation

要約 新しく提案された Generalized Referring Expres … 続きを読む

カテゴリー: cs.AI, cs.CV | HDC: Hierarchical Semantic Decoding with Counting Assistance for Generalized Referring Expression Segmentation はコメントを受け付けていません

Exposing Image Classifier Shortcuts with Counterfactual Frequency (CoF) Tables

要約 画像分類におけるディープラーニングの台頭により、前例のない精度がもたらされ … 続きを読む

カテゴリー: cs.AI, cs.CV | Exposing Image Classifier Shortcuts with Counterfactual Frequency (CoF) Tables はコメントを受け付けていません

VDGD: Mitigating LVLM Hallucinations in Cognitive Prompts by Bridging the Visual Perception Gap

要約 実用的なアプリケーションとしての大規模視覚言語モデル (LVLM) への最 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | VDGD: Mitigating LVLM Hallucinations in Cognitive Prompts by Bridging the Visual Perception Gap はコメントを受け付けていません

Fast Sampling Through The Reuse Of Attention Maps In Diffusion Models

要約 テキストから画像への拡散モデルは、柔軟でリアルな画像合成のための前例のない … 続きを読む

カテゴリー: cs.AI, cs.CV | Fast Sampling Through The Reuse Of Attention Maps In Diffusion Models はコメントを受け付けていません

Prompt-Aware Adapter: Towards Learning Adaptive Visual Tokens for Multimodal Large Language Models

要約 視覚と言語モダリティの間のギャップを埋めるために、マルチモーダル大規模言語 … 続きを読む

カテゴリー: cs.AI, cs.CV | Prompt-Aware Adapter: Towards Learning Adaptive Visual Tokens for Multimodal Large Language Models はコメントを受け付けていません

Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model

要約 ControlNet は、深度マップ、落書き/スケッチ、人間のポーズなど、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model はコメントを受け付けていません

WorDepth: Variational Language Prior for Monocular Depth Estimation

要約 単一の画像からの 3 次元 (3D) 再構成は、スケールなどの固有の曖昧さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | WorDepth: Variational Language Prior for Monocular Depth Estimation はコメントを受け付けていません

Score identity Distillation: Exponentially Fast Distillation of Pretrained Diffusion Models for One-Step Generation

要約 スコア同一性蒸留 (SiD) を導入します。これは、事前トレーニングされた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | Score identity Distillation: Exponentially Fast Distillation of Pretrained Diffusion Models for One-Step Generation はコメントを受け付けていません