月別アーカイブ: 2025年2月

From Correctness to Comprehension: AI Agents for Personalized Error Diagnosis in Education

投稿日: 2025年2月20日作成者: jarxiv

要約 GPT-4などの大規模な言語モデル（LLM）は、GSM8Kなどのベンチマー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Rethinking Audio-Visual Adversarial Vulnerability from Temporal and Modality Perspectives

投稿日: 2025年2月20日作成者: jarxiv

要約視聴覚学習は、複数の感覚モダリティを活用することにより、現実の世界をより豊 … 続きを読む →

カテゴリー: cs.CV, cs.SD | コメントを受け付けていません

3D Gaussian Splatting aided Localization for Large and Complex Indoor-Environments

投稿日: 2025年2月20日作成者: jarxiv

要約視覚的ローカリゼーションの分野は数十年にわたって研究されており、その間に多 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

ChineseSimpleVQA — ‘See the World, Discover Knowledge’: A Chinese Factuality Evaluation for Large Vision Language Models

投稿日: 2025年2月20日作成者: jarxiv

要約大規模なビジョン言語モデル（LVLMS）における事実上の精度の評価は、急速 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

MGFI-Net: A Multi-Grained Feature Integration Network for Enhanced Medical Image Segmentation

投稿日: 2025年2月20日作成者: jarxiv

要約医療画像セグメンテーションは、さまざまな臨床応用で重要な役割を果たしていま … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Building Age Estimation: A New Multi-Modal Benchmark Dataset and Community Challenge

投稿日: 2025年2月20日作成者: jarxiv

要約建物の建設年を推定することは、持続可能性にとって非常に重要です。持続可能 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

DiffGuard: Text-Based Safety Checker for Diffusion Models

投稿日: 2025年2月20日作成者: jarxiv

要約拡散モデルの最近の進歩により、テキストからの画像の生成が可能になり、Dal … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Are generative models fair? A study of racial bias in dermatological image generation

投稿日: 2025年2月20日作成者: jarxiv

要約皮膚科のような医学の人種的偏見は、重要な倫理的および臨床的課題を提示してい … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Generative Video Semantic Communication via Multimodal Semantic Fusion with Large Model

投稿日: 2025年2月20日作成者: jarxiv

要約シャノンの理論に基づいた伝統的な構文通信の大幅な進歩にもかかわらず、これら … 続きを読む →

カテゴリー: cs.CV, cs.IT, eess.IV, eess.SP, math.IT | コメントを受け付けていません

Efficient Dataset Distillation via Diffusion-Driven Patch Selection for Improved Generalization

投稿日: 2025年2月20日作成者: jarxiv

要約データセット蒸留は、フルスケールのオリジナルに匹敵するパフォーマンスを備え … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年2月

From Correctness to Comprehension: AI Agents for Personalized Error Diagnosis in Education

Rethinking Audio-Visual Adversarial Vulnerability from Temporal and Modality Perspectives

3D Gaussian Splatting aided Localization for Large and Complex Indoor-Environments

ChineseSimpleVQA — ‘See the World, Discover Knowledge’: A Chinese Factuality Evaluation for Large Vision Language Models

MGFI-Net: A Multi-Grained Feature Integration Network for Enhanced Medical Image Segmentation

Building Age Estimation: A New Multi-Modal Benchmark Dataset and Community Challenge

DiffGuard: Text-Based Safety Checker for Diffusion Models

Are generative models fair? A study of racial bias in dermatological image generation

Generative Video Semantic Communication via Multimodal Semantic Fusion with Large Model

Efficient Dataset Distillation via Diffusion-Driven Patch Selection for Improved Generalization

最近の投稿

最近のコメント

アーカイブ

カテゴリー