「cs.MM」カテゴリーアーカイブ

Two-Stage Triplet Loss Training with Curriculum Augmentation for Audio-Visual Retrieval

投稿日: 2023年10月23日作成者: jarxiv

要約クロスモーダル検索モデルは、三重損失最適化の可能性を活用して、堅牢な埋め込 … 続きを読む →

カテゴリー: cs.CV, cs.IR, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

MolCA: Molecular Graph-Language Modeling with Cross-Modal Projector and Uni-Modal Adapter

投稿日: 2023年10月20日作成者: jarxiv

要約言語モデル (LM) は、さまざまな 1D テキスト関連タスクにおいて優れ … 続きを読む →

カテゴリー: cs.CL, cs.MM | コメントを受け付けていません

Generating Robust Adversarial Examples against Online Social Networks (OSNs)

投稿日: 2023年10月20日作成者: jarxiv

要約オンラインソーシャルネットワーク (OSN) は、現代の画像の一般的な … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

MusicAgent: An AI Agent for Music Understanding and Generation with Large Language Models

投稿日: 2023年10月19日作成者: jarxiv

要約 AI を活用した音楽処理は、生成タスク (音色合成など) から理解タスク … 続きを読む →

カテゴリー: cs.CL, cs.MM, eess.AS | コメントを受け付けていません

VERITE: A Robust Benchmark for Multimodal Misinformation Detection Accounting for Unimodal Bias

投稿日: 2023年10月19日作成者: jarxiv

要約マルチメディアコンテンツがソーシャルメディアプラットフォーム上で遍在 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Non-Intrusive Adaptation: Input-Centric Parameter-efficient Fine-Tuning for Versatile Multimodal Modeling

投稿日: 2023年10月19日作成者: jarxiv

要約大規模言語モデル (LLM) とビジョン言語モデル (VLM) は、パラメ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Learning Comprehensive Representations with Richer Self for Text-to-Image Person Re-Identification

投稿日: 2023年10月18日作成者: jarxiv

要約テキストから画像への人物再識別 (TIReID) は、クエリテキストに基 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

An empirical study of automatic wildlife detection using drone thermal imaging and object detection

投稿日: 2023年10月18日作成者: jarxiv

要約人工知能は、野生動物データの収集と解釈のための費用対効果の高い方法を通じて … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.RO | コメントを受け付けていません

Improving Anomaly Segmentation with Multi-Granularity Cross-Domain Alignment

投稿日: 2023年10月17日作成者: jarxiv

要約異常セグメンテーションは、画像内の異常な物体を識別する上で極めて重要な役割 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

PoSynDA: Multi-Hypothesis Pose Synthesis Domain Adaptation for Robust 3D Human Pose Estimation

投稿日: 2023年10月17日作成者: jarxiv

要約既存の 3D 人間の姿勢推定器は、トレーニングセットに 2D-3D の姿 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM, cs.RO | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

Two-Stage Triplet Loss Training with Curriculum Augmentation for Audio-Visual Retrieval

MolCA: Molecular Graph-Language Modeling with Cross-Modal Projector and Uni-Modal Adapter

Generating Robust Adversarial Examples against Online Social Networks (OSNs)

MusicAgent: An AI Agent for Music Understanding and Generation with Large Language Models

VERITE: A Robust Benchmark for Multimodal Misinformation Detection Accounting for Unimodal Bias

Non-Intrusive Adaptation: Input-Centric Parameter-efficient Fine-Tuning for Versatile Multimodal Modeling

Learning Comprehensive Representations with Richer Self for Text-to-Image Person Re-Identification

An empirical study of automatic wildlife detection using drone thermal imaging and object detection

Improving Anomaly Segmentation with Multi-Granularity Cross-Domain Alignment

PoSynDA: Multi-Hypothesis Pose Synthesis Domain Adaptation for Robust 3D Human Pose Estimation

最近の投稿

最近のコメント

アーカイブ

カテゴリー