cs.CV」カテゴリーアーカイブ

Building Age Estimation: A New Multi-Modal Benchmark Dataset and Community Challenge

要約 建物の建設年を推定することは、持続可能性にとって非常に重要です。 持続可能 … 続きを読む

カテゴリー: cs.CV, cs.LG | Building Age Estimation: A New Multi-Modal Benchmark Dataset and Community Challenge はコメントを受け付けていません

DiffGuard: Text-Based Safety Checker for Diffusion Models

要約 拡散モデルの最近の進歩により、テキストからの画像の生成が可能になり、Dal … 続きを読む

カテゴリー: cs.AI, cs.CV | DiffGuard: Text-Based Safety Checker for Diffusion Models はコメントを受け付けていません

Are generative models fair? A study of racial bias in dermatological image generation

要約 皮膚科のような医学の人種的偏見は、重要な倫理的および臨床的課題を提示してい … 続きを読む

カテゴリー: cs.CV | Are generative models fair? A study of racial bias in dermatological image generation はコメントを受け付けていません

Generative Video Semantic Communication via Multimodal Semantic Fusion with Large Model

要約 シャノンの理論に基づいた伝統的な構文通信の大幅な進歩にもかかわらず、これら … 続きを読む

カテゴリー: cs.CV, cs.IT, eess.IV, eess.SP, math.IT | Generative Video Semantic Communication via Multimodal Semantic Fusion with Large Model はコメントを受け付けていません

Efficient Dataset Distillation via Diffusion-Driven Patch Selection for Improved Generalization

要約 データセット蒸留は、フルスケールのオリジナルに匹敵するパフォーマンスを備え … 続きを読む

カテゴリー: cs.CV | Efficient Dataset Distillation via Diffusion-Driven Patch Selection for Improved Generalization はコメントを受け付けていません

PoGDiff: Product-of-Gaussians Diffusion Models for Imbalanced Text-to-Image Generation

要約 拡散モデルは、近年大きな進歩を遂げています。 ただし、不均衡なデータセット … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | PoGDiff: Product-of-Gaussians Diffusion Models for Imbalanced Text-to-Image Generation はコメントを受け付けていません

MagicGeo: Training-Free Text-Guided Geometric Diagram Generation

要約 幾何学的図は、数学的および科学的概念を伝える上で重要ですが、従来の図の生成 … 続きを読む

カテゴリー: cs.CV | MagicGeo: Training-Free Text-Guided Geometric Diagram Generation はコメントを受け付けていません

Regularization by Neural Style Transfer for MRI Field-Transfer Reconstruction with Limited Data

要約 MRI再構築における最近の進歩は、深い学習ベースのモデルを通じて顕著な成功 … 続きを読む

カテゴリー: cs.CV, cs.LG, physics.med-ph | Regularization by Neural Style Transfer for MRI Field-Transfer Reconstruction with Limited Data はコメントを受け付けていません

MSVCOD:A Large-Scale Multi-Scene Dataset for Video Camouflage Object Detection

要約 ビデオカモフラージュオブジェクト検出(VCOD)は、ビデオのバックグラウン … 続きを読む

カテゴリー: cs.CV | MSVCOD:A Large-Scale Multi-Scene Dataset for Video Camouflage Object Detection はコメントを受け付けていません

Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention

要約 感情を理解することは、人間のコミュニケーションの基本的な側面です。 オーデ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM, cs.SD, eess.AS, F.2.2 | Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention はコメントを受け付けていません