月別アーカイブ: 2025年2月

ChineseSimpleVQA — ‘See the World, Discover Knowledge’: A Chinese Factuality Evaluation for Large Vision Language Models

要約 大規模なビジョン言語モデル(LVLMS)における事実上の精度の評価は、急速 … 続きを読む

カテゴリー: cs.CL, cs.CV | ChineseSimpleVQA — ‘See the World, Discover Knowledge’: A Chinese Factuality Evaluation for Large Vision Language Models はコメントを受け付けていません

What Is That Talk About? A Video-to-Text Summarization Dataset for Scientific Presentations

要約 記録されたビデオを簡潔で正確なテキストの概要に変換することは、マルチモーダ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | What Is That Talk About? A Video-to-Text Summarization Dataset for Scientific Presentations はコメントを受け付けていません

Potential Field as Scene Affordance for Behavior Change-Based Visual Risk Object Identification

要約 行動変化に基づく視覚リスクオブジェクト識別(Visual-Roi)を研究し … 続きを読む

カテゴリー: cs.CV | Potential Field as Scene Affordance for Behavior Change-Based Visual Risk Object Identification はコメントを受け付けていません

Physics-informed Variational Autoencoders for Improved Robustness to Environmental Factors of Variation

要約 機械学習モデルと物理モデルの組み合わせは、堅牢なデータ表現を学習するための … 続きを読む

カテゴリー: 68T45, cs.CV, I.2.10, stat.ML | Physics-informed Variational Autoencoders for Improved Robustness to Environmental Factors of Variation はコメントを受け付けていません

RetinaRegen: A Hybrid Model for Readability and Detail Restoration in Fundus Images

要約 眼底の画質は眼疾患を診断するために重要ですが、実際の状態はしばしばぼやけた … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | RetinaRegen: A Hybrid Model for Readability and Detail Restoration in Fundus Images はコメントを受け付けていません

A Sliding Layer Merging Method for Efficient Depth-Wise Pruning in LLMs

要約 幅では剪定と比較して、深さごとの剪定は、リソース制約のシナリオで推論を大幅 … 続きを読む

カテゴリー: cs.CV | A Sliding Layer Merging Method for Efficient Depth-Wise Pruning in LLMs はコメントを受け付けていません

Spatial-Mamba: Effective Visual State Space Models via Structure-aware State Fusion

要約 Mambaなどの選択的状態空間モデル(SSM)は、1Dシーケンシャルデータ … 続きを読む

カテゴリー: cs.CV | Spatial-Mamba: Effective Visual State Space Models via Structure-aware State Fusion はコメントを受け付けていません

Knowledge Distillation for Semantic Segmentation: A Label Space Unification Approach

要約 過去数年にわたって、セマンティックセグメンテーションのために同様のドメイン … 続きを読む

カテゴリー: cs.CV | Knowledge Distillation for Semantic Segmentation: A Label Space Unification Approach はコメントを受け付けていません

Multi-level Attention-guided Graph Neural Network for Image Restoration

要約 近年、深い学習は、画像修復の分野で顕著な成功を収めています。 ただし、ほと … 続きを読む

カテゴリー: cs.CV, eess.IV | Multi-level Attention-guided Graph Neural Network for Image Restoration はコメントを受け付けていません

Espresso: Robust Concept Filtering in Text-to-Image Models

要約 拡散ベースのテキストから画像モデルは、インターネットから削られた大きなデー … 続きを読む

カテゴリー: cs.CR, cs.CV | Espresso: Robust Concept Filtering in Text-to-Image Models はコメントを受け付けていません