月別アーカイブ: 2025年2月

From Correctness to Comprehension: AI Agents for Personalized Error Diagnosis in Education

要約 GPT-4などの大規模な言語モデル(LLM)は、GSM8Kなどのベンチマー … 続きを読む

カテゴリー: cs.CV | From Correctness to Comprehension: AI Agents for Personalized Error Diagnosis in Education はコメントを受け付けていません

Rethinking Audio-Visual Adversarial Vulnerability from Temporal and Modality Perspectives

要約 視聴覚学習は、複数の感覚モダリティを活用することにより、現実の世界をより豊 … 続きを読む

カテゴリー: cs.CV, cs.SD | Rethinking Audio-Visual Adversarial Vulnerability from Temporal and Modality Perspectives はコメントを受け付けていません

3D Gaussian Splatting aided Localization for Large and Complex Indoor-Environments

要約 視覚的ローカリゼーションの分野は数十年にわたって研究されており、その間に多 … 続きを読む

カテゴリー: cs.CV, cs.RO | 3D Gaussian Splatting aided Localization for Large and Complex Indoor-Environments はコメントを受け付けていません

ChineseSimpleVQA — ‘See the World, Discover Knowledge’: A Chinese Factuality Evaluation for Large Vision Language Models

要約 大規模なビジョン言語モデル(LVLMS)における事実上の精度の評価は、急速 … 続きを読む

カテゴリー: cs.CL, cs.CV | ChineseSimpleVQA — ‘See the World, Discover Knowledge’: A Chinese Factuality Evaluation for Large Vision Language Models はコメントを受け付けていません

MGFI-Net: A Multi-Grained Feature Integration Network for Enhanced Medical Image Segmentation

要約 医療画像セグメンテーションは、さまざまな臨床応用で重要な役割を果たしていま … 続きを読む

カテゴリー: cs.CV, eess.IV | MGFI-Net: A Multi-Grained Feature Integration Network for Enhanced Medical Image Segmentation はコメントを受け付けていません

Building Age Estimation: A New Multi-Modal Benchmark Dataset and Community Challenge

要約 建物の建設年を推定することは、持続可能性にとって非常に重要です。 持続可能 … 続きを読む

カテゴリー: cs.CV, cs.LG | Building Age Estimation: A New Multi-Modal Benchmark Dataset and Community Challenge はコメントを受け付けていません

DiffGuard: Text-Based Safety Checker for Diffusion Models

要約 拡散モデルの最近の進歩により、テキストからの画像の生成が可能になり、Dal … 続きを読む

カテゴリー: cs.AI, cs.CV | DiffGuard: Text-Based Safety Checker for Diffusion Models はコメントを受け付けていません

Are generative models fair? A study of racial bias in dermatological image generation

要約 皮膚科のような医学の人種的偏見は、重要な倫理的および臨床的課題を提示してい … 続きを読む

カテゴリー: cs.CV | Are generative models fair? A study of racial bias in dermatological image generation はコメントを受け付けていません

Generative Video Semantic Communication via Multimodal Semantic Fusion with Large Model

要約 シャノンの理論に基づいた伝統的な構文通信の大幅な進歩にもかかわらず、これら … 続きを読む

カテゴリー: cs.CV, cs.IT, eess.IV, eess.SP, math.IT | Generative Video Semantic Communication via Multimodal Semantic Fusion with Large Model はコメントを受け付けていません

Efficient Dataset Distillation via Diffusion-Driven Patch Selection for Improved Generalization

要約 データセット蒸留は、フルスケールのオリジナルに匹敵するパフォーマンスを備え … 続きを読む

カテゴリー: cs.CV | Efficient Dataset Distillation via Diffusion-Driven Patch Selection for Improved Generalization はコメントを受け付けていません