月別アーカイブ: 2024年8月

SynopGround: A Large-Scale Dataset for Multi-Paragraph Video Grounding from TV Dramas and Synopses

要約 ビデオ グラウンディングは、マルチモーダル コンテンツの理解における基本的 … 続きを読む

カテゴリー: cs.CV, cs.MM | SynopGround: A Large-Scale Dataset for Multi-Paragraph Video Grounding from TV Dramas and Synopses はコメントを受け付けていません

Pick of the Bunch: Detecting Infrared Small Targets Beyond Hit-Miss Trade-Offs via Selective Rank-Aware Attention

要約 赤外線による小型ターゲットの検出は、複雑な背景の乱雑さの中で薄暗いターゲッ … 続きを読む

カテゴリー: cs.CV | Pick of the Bunch: Detecting Infrared Small Targets Beyond Hit-Miss Trade-Offs via Selective Rank-Aware Attention はコメントを受け付けていません

Soft-Hard Attention U-Net Model and Benchmark Dataset for Multiscale Image Shadow Removal

要約 効果的な影の除去は、コンピュータ ビジョンからデジタル写真に至るまで、さま … 続きを読む

カテゴリー: cs.CV | Soft-Hard Attention U-Net Model and Benchmark Dataset for Multiscale Image Shadow Removal はコメントを受け付けていません

Advancing Multimodal Large Language Models with Quantization-Aware Scale Learning for Efficient Adaptation

要約 この論文では、ビジョン言語命令の調整中に遭遇する重大なリソース制約を軽減す … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Advancing Multimodal Large Language Models with Quantization-Aware Scale Learning for Efficient Adaptation はコメントを受け付けていません

Intuitionistic Fuzzy Cognitive Maps for Interpretable Image Classification

要約 ユーザーは推論に頼ることに消極的な場合があるため、機械学習モデルの解釈可能 … 続きを読む

カテゴリー: cs.AI, cs.CV | Intuitionistic Fuzzy Cognitive Maps for Interpretable Image Classification はコメントを受け付けていません

Distill Gold from Massive Ores: Bi-level Data Pruning towards Efficient Dataset Distillation

要約 データ効率の高い学習は、特に大規模なマルチモーダル モデルの現在の傾向を考 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Distill Gold from Massive Ores: Bi-level Data Pruning towards Efficient Dataset Distillation はコメントを受け付けていません

Data Generation Scheme for Thermal Modality with Edge-Guided Adversarial Conditional Diffusion Model

要約 困難な低光量および悪天候条件において、可視視覚アルゴリズムが頻繁に直面する … 続きを読む

カテゴリー: cs.CV | Data Generation Scheme for Thermal Modality with Edge-Guided Adversarial Conditional Diffusion Model はコメントを受け付けていません

3iGS: Factorised Tensorial Illumination for 3D Gaussian Splatting

要約 放射輝度フィールドの表現として 3D ガウスを使用することにより、リアルタ … 続きを読む

カテゴリー: cs.CV | 3iGS: Factorised Tensorial Illumination for 3D Gaussian Splatting はコメントを受け付けていません

Improving Composed Image Retrieval via Contrastive Learning with Scaling Positives and Negatives

要約 合成画像取得 (CIR) タスクは、参照画像と変更されたテキストで構成され … 続きを読む

カテゴリー: cs.AI, cs.CV | Improving Composed Image Retrieval via Contrastive Learning with Scaling Positives and Negatives はコメントを受け付けていません

EqvAfford: SE(3) Equivariance for Point-Level Affordance Learning

要約 人間は等変性を意識して世界を認識し、相互作用するため、さまざまなポーズでさ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | EqvAfford: SE(3) Equivariance for Point-Level Affordance Learning はコメントを受け付けていません