月別アーカイブ: 2025年2月

ChineseSimpleVQA — ‘See the World, Discover Knowledge’: A Chinese Factuality Evaluation for Large Vision Language Models

投稿日: 2025年2月27日作成者: jarxiv

要約大規模なビジョン言語モデル（LVLMS）における事実上の精度の評価は、急速 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

What Is That Talk About? A Video-to-Text Summarization Dataset for Scientific Presentations

投稿日: 2025年2月27日作成者: jarxiv

要約記録されたビデオを簡潔で正確なテキストの概要に変換することは、マルチモーダ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Potential Field as Scene Affordance for Behavior Change-Based Visual Risk Object Identification

投稿日: 2025年2月27日作成者: jarxiv

要約行動変化に基づく視覚リスクオブジェクト識別（Visual-Roi）を研究し … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Physics-informed Variational Autoencoders for Improved Robustness to Environmental Factors of Variation

投稿日: 2025年2月27日作成者: jarxiv

要約機械学習モデルと物理モデルの組み合わせは、堅牢なデータ表現を学習するための … 続きを読む →

カテゴリー: 68T45, cs.CV, I.2.10, stat.ML | コメントを受け付けていません

RetinaRegen: A Hybrid Model for Readability and Detail Restoration in Fundus Images

投稿日: 2025年2月27日作成者: jarxiv

要約眼底の画質は眼疾患を診断するために重要ですが、実際の状態はしばしばぼやけた … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

A Sliding Layer Merging Method for Efficient Depth-Wise Pruning in LLMs

投稿日: 2025年2月27日作成者: jarxiv

要約幅では剪定と比較して、深さごとの剪定は、リソース制約のシナリオで推論を大幅 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Spatial-Mamba: Effective Visual State Space Models via Structure-aware State Fusion

投稿日: 2025年2月27日作成者: jarxiv

要約 Mambaなどの選択的状態空間モデル（SSM）は、1Dシーケンシャルデータ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Knowledge Distillation for Semantic Segmentation: A Label Space Unification Approach

投稿日: 2025年2月27日作成者: jarxiv

要約過去数年にわたって、セマンティックセグメンテーションのために同様のドメイン … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Multi-level Attention-guided Graph Neural Network for Image Restoration

投稿日: 2025年2月27日作成者: jarxiv

要約近年、深い学習は、画像修復の分野で顕著な成功を収めています。ただし、ほと … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Espresso: Robust Concept Filtering in Text-to-Image Models

投稿日: 2025年2月27日作成者: jarxiv

要約拡散ベースのテキストから画像モデルは、インターネットから削られた大きなデー … 続きを読む →

カテゴリー: cs.CR, cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年2月

ChineseSimpleVQA — ‘See the World, Discover Knowledge’: A Chinese Factuality Evaluation for Large Vision Language Models

What Is That Talk About? A Video-to-Text Summarization Dataset for Scientific Presentations

Potential Field as Scene Affordance for Behavior Change-Based Visual Risk Object Identification

Physics-informed Variational Autoencoders for Improved Robustness to Environmental Factors of Variation

RetinaRegen: A Hybrid Model for Readability and Detail Restoration in Fundus Images

A Sliding Layer Merging Method for Efficient Depth-Wise Pruning in LLMs

Spatial-Mamba: Effective Visual State Space Models via Structure-aware State Fusion

Knowledge Distillation for Semantic Segmentation: A Label Space Unification Approach

Multi-level Attention-guided Graph Neural Network for Image Restoration

Espresso: Robust Concept Filtering in Text-to-Image Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー