月別アーカイブ: 2023年9月

A Comprehensive Analysis of AI Biases in DeepFake Detection With Massively Annotated Databases

要約 近年、ディープフェイクによる画像や動画の改ざんは、セキュリティや社会にとっ … 続きを読む

カテゴリー: cs.CV, cs.CY, cs.LG | A Comprehensive Analysis of AI Biases in DeepFake Detection With Massively Annotated Databases はコメントを受け付けていません

Budget-Aware Pruning: Handling Multiple Domains with Less Parameters

要約 深層学習は、いくつかのコンピューター ビジョン タスクおよびドメインで最先 … 続きを読む

カテゴリー: cs.CV | Budget-Aware Pruning: Handling Multiple Domains with Less Parameters はコメントを受け付けていません

CATR: Combinatorial-Dependence Audio-Queried Transformer for Audio-Visual Video Segmentation

要約 オーディオビジュアルビデオセグメンテーション (AVVS) は、画像フレー … 続きを読む

カテゴリー: cs.CV | CATR: Combinatorial-Dependence Audio-Queried Transformer for Audio-Visual Video Segmentation はコメントを受け付けていません

DeepAqua: Self-Supervised Semantic Segmentation of Wetland Surface Water Extent with SAR Images using Knowledge Distillation

要約 ディープラーニングとリモートセンシング技術により、水監視能力が大幅に向上し … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | DeepAqua: Self-Supervised Semantic Segmentation of Wetland Surface Water Extent with SAR Images using Knowledge Distillation はコメントを受け付けていません

FreeU: Free Lunch in Diffusion U-Net

要約 この論文では、その場で生成品質を大幅に向上させる「フリーランチ」として機能 … 続きを読む

カテゴリー: cs.CV | FreeU: Free Lunch in Diffusion U-Net はコメントを受け付けていません

DreamLLM: Synergistic Multimodal Comprehension and Creation

要約 この論文では、マルチモーダルな理解と作成の間で見落とされがちな相乗効果を強 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | DreamLLM: Synergistic Multimodal Comprehension and Creation はコメントを受け付けていません

A Large-scale Dataset for Audio-Language Representation Learning

要約 AI コミュニティは、大規模なマルチモーダル データセットを活用した強力な … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | A Large-scale Dataset for Audio-Language Representation Learning はコメントを受け付けていません

GloPro: Globally-Consistent Uncertainty-Aware 3D Human Pose Estimation & Tracking in the Wild

要約 正確で不確実性を考慮した 3D 人体の姿勢推定は、真に安全かつ効率的な人間 … 続きを読む

カテゴリー: cs.CV, cs.RO | GloPro: Globally-Consistent Uncertainty-Aware 3D Human Pose Estimation & Tracking in the Wild はコメントを受け付けていません

MelodyGLM: Multi-task Pre-training for Symbolic Melody Generation

要約 事前トレーニングされた言語モデルは、さまざまな音楽の理解と生成のタスクにお … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.MM, cs.SD, eess.AS | MelodyGLM: Multi-task Pre-training for Symbolic Melody Generation はコメントを受け付けていません

KFC: Kinship Verification with Fair Contrastive Loss and Multi-Task Learning

要約 親族関係の検証は、複数の潜在的なアプリケーションを持つコンピューター ビジ … 続きを読む

カテゴリー: cs.CV | KFC: Kinship Verification with Fair Contrastive Loss and Multi-Task Learning はコメントを受け付けていません