「cs.MM」カテゴリーアーカイブ

GraphCFC: A Directed Graph Based Cross-Modal Feature Complementation Approach for Multimodal Conversational Emotion Recognition

投稿日: 2023年11月23日作成者: jarxiv

要約会話中の感情認識 (ERC) は、共感的なサービスを提供できるため、ヒュー … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.MM | コメントを受け付けていません

Rethinking Radiology Report Generation via Causal Reasoning and Counterfactual Augmentation

投稿日: 2023年11月23日作成者: jarxiv

要約 Radiology Report Generation (RRG) は、視 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.MM | コメントを受け付けていません

CompenHR: Efficient Full Compensation for High-resolution Projector

投稿日: 2023年11月23日作成者: jarxiv

要約プロジェクターを完全に補償することは、プロジェクターカメラシステムの実 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

LucidDreamer: Towards High-Fidelity Text-to-3D Generation via Interval Score Matching

投稿日: 2023年11月23日作成者: jarxiv

要約テキストから 3D への生成における最近の進歩は、生成モデルにおける重要な … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.MM | コメントを受け付けていません

Enhancing Multi-modal Cooperation via Fine-grained Modality Valuation

投稿日: 2023年11月22日作成者: jarxiv

要約マルチモーダル学習の主なトピックの 1 つは、異なるモダリティからの異種情 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Towards Natural Language-Guided Drones: GeoText-1652 Benchmark with Spatially Relation Matching

投稿日: 2023年11月22日作成者: jarxiv

要約自然言語コマンドによるドローンのナビゲーションは、公的に利用可能なマルチモ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Emu Video: Factorizing Text-to-Video Generation by Explicit Image Conditioning

投稿日: 2023年11月20日作成者: jarxiv

要約我々は、生成を 2 つのステップに分解するテキストからビデオへの生成モデル … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, cs.MM | コメントを受け付けていません

RED-DOT: Multimodal Fact-checking via Relevant Evidence Detection

投稿日: 2023年11月17日作成者: jarxiv

要約オンラインの誤った情報は本質的に多峰性であることが多く、テキストと付随する … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Differentiable JPEG: The Devil is in the Details

投稿日: 2023年11月17日作成者: jarxiv

要約 JPEG は、依然として最も広く普及している非可逆画像符号化方式の 1 つ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

GANonymization: A GAN-based Face Anonymization Framework for Preserving Emotional Expressions

投稿日: 2023年11月15日作成者: jarxiv

要約近年、個人データの可用性が増加しているため、プライバシーとセキュリティに関 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

GraphCFC: A Directed Graph Based Cross-Modal Feature Complementation Approach for Multimodal Conversational Emotion Recognition

Rethinking Radiology Report Generation via Causal Reasoning and Counterfactual Augmentation

CompenHR: Efficient Full Compensation for High-resolution Projector

LucidDreamer: Towards High-Fidelity Text-to-3D Generation via Interval Score Matching

Enhancing Multi-modal Cooperation via Fine-grained Modality Valuation

Towards Natural Language-Guided Drones: GeoText-1652 Benchmark with Spatially Relation Matching

Emu Video: Factorizing Text-to-Video Generation by Explicit Image Conditioning

RED-DOT: Multimodal Fact-checking via Relevant Evidence Detection

Differentiable JPEG: The Devil is in the Details

GANonymization: A GAN-based Face Anonymization Framework for Preserving Emotional Expressions

最近の投稿

最近のコメント

アーカイブ

カテゴリー