cs.MM」カテゴリーアーカイブ

On the Importance of Noise Scheduling for Diffusion Models

要約 拡散生成モデルのノイズを除去するためのノイズスケジューリング戦略の効果を経 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG, cs.MM | On the Importance of Noise Scheduling for Diffusion Models はコメントを受け付けていません

Protein Representation Learning via Knowledge Enhanced Primary Structure Modeling

要約 タンパク質表現学習は、主に言語モデル (LM) の目覚ましい発展の恩恵を受 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.MM | Protein Representation Learning via Knowledge Enhanced Primary Structure Modeling はコメントを受け付けていません

Deepfake Detection: A Comprehensive Study from the Reliability Perspective

要約 インターネット上で流通しているディープフェイクの合成素材は、政治家、有名人 … 続きを読む

カテゴリー: cs.CV, cs.MM | Deepfake Detection: A Comprehensive Study from the Reliability Perspective はコメントを受け付けていません

3D-VFD: A Victim-free Detector against 3D Adversarial Point Clouds

要約 点群を使用する 3D ディープ モデルは、コンピューター ビジョンで優れた … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | 3D-VFD: A Victim-free Detector against 3D Adversarial Point Clouds はコメントを受け付けていません

VoLTA: Vision-Language Transformer with Weakly-Supervised Local-Feature Alignment

要約 ビジョン言語事前トレーニング (VLP) は、最近、さまざまなユニモーダル … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM | VoLTA: Vision-Language Transformer with Weakly-Supervised Local-Feature Alignment はコメントを受け付けていません

Towards Robust Neural Image Compression: Adversarial Attack and Model Finetuning

要約 ディープ ニューラル ネットワークに基づく画像圧縮は、広く研究されています … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | Towards Robust Neural Image Compression: Adversarial Attack and Model Finetuning はコメントを受け付けていません

DiffFaceSketch: High-Fidelity Face Image Synthesis with Sketch-Guided Latent Diffusion Model

要約 モノクロ スケッチから顔画像を合成することは、画像から画像への変換の分野で … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | DiffFaceSketch: High-Fidelity Face Image Synthesis with Sketch-Guided Latent Diffusion Model はコメントを受け付けていません

Zero3D: Semantic-Driven Multi-Category 3D Shape Generation

要約 セマンティック主導の 3D 形状生成は、テキストに基づいて調整された 3D … 続きを読む

カテゴリー: cs.CV, cs.MM | Zero3D: Semantic-Driven Multi-Category 3D Shape Generation はコメントを受け付けていません

LaT: Latent Translation with Cycle-Consistency for Video-Text Retrieval

要約 ビデオテキスト検索は、クロスモーダル表現学習問題のクラスであり、その目標は … 続きを読む

カテゴリー: cs.CV, cs.MM | LaT: Latent Translation with Cycle-Consistency for Video-Text Retrieval はコメントを受け付けていません

Video compression dataset and benchmark of learning-based video-quality metrics

要約 映像品質測定は、映像処理における重要なタスクである。現在、AV1、VVC、 … 続きを読む

カテゴリー: cs.CV, cs.MM | Video compression dataset and benchmark of learning-based video-quality metrics はコメントを受け付けていません