「cs.MM」カテゴリーアーカイブ

Lost in Overlap: Exploring Watermark Collision in LLMs

投稿日: 2024年8月15日作成者: jarxiv

要約コンテンツ生成における大規模言語モデル (LLM) の急増により、テキスト … 続きを読む →

カテゴリー: cs.CL, cs.MM | コメントを受け付けていません

3D Gaussian Editing with A Single Image

投稿日: 2024年8月15日作成者: jarxiv

要約現実世界からキャプチャされた 3D シーンのモデリングと操作は、さまざまな … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

End-to-end Semantic-centric Video-based Multimodal Affective Computing

投稿日: 2024年8月15日作成者: jarxiv

要約汎用人工知能 (AGI) への道において、人間の愛情を理解することは、機械 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Generative AI for Immersive Communication: The Next Frontier in Internet-of-Senses Through 6G

投稿日: 2024年8月14日作成者: jarxiv

要約過去 20 年にわたり、モノのインターネット (IoT) は変革的な概念と … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.HC, cs.MM, cs.NI | コメントを受け付けていません

Diseño de sonido para producciones audiovisuales e historias sonoras en el aula. Hacia una docencia creativa mediante el uso de herramientas inteligentes

投稿日: 2024年8月13日作成者: jarxiv

要約この研究は、オーディオビジュアル作品のサウンドデザインを教えた教育経験を共 … 続きを読む →

カテゴリー: cs.AI, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

DPDETR: Decoupled Position Detection Transformer for Infrared-Visible Object Detection

投稿日: 2024年8月13日作成者: jarxiv

要約赤外線可視物体検出は、赤外線画像と可視画像のペアの補完情報を活用することで … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Palantir: Towards Efficient Super Resolution for Ultra-high-definition Live Streaming

投稿日: 2024年8月13日作成者: jarxiv

要約超解像度ディープニューラルネットワークによるニューラルの強化により、既 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM, cs.NI | コメントを受け付けていません

Rethinking Video with a Universal Event-Based Representation

投稿日: 2024年8月13日作成者: jarxiv

要約従来、ビデオは一連の個別の画像フレームとして構造化されていました。しかし … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Benchmarking Conventional and Learned Video Codecs with a Low-Delay Configuration

投稿日: 2024年8月12日作成者: jarxiv

要約最近のビデオ圧縮の進歩により、新しい標準と学習ベースのビデオコーデックの … 続きを読む →

カテゴリー: cs.CV, cs.MM, eess.IV | コメントを受け付けていません

Loc4Plan: Locating Before Planning for Outdoor Vision and Language Navigation

投稿日: 2024年8月12日作成者: jarxiv

要約視覚と言語ナビゲーション (VLN) は、エージェントが指示を理解し、視覚 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

Lost in Overlap: Exploring Watermark Collision in LLMs

3D Gaussian Editing with A Single Image

End-to-end Semantic-centric Video-based Multimodal Affective Computing

Generative AI for Immersive Communication: The Next Frontier in Internet-of-Senses Through 6G

Diseño de sonido para producciones audiovisuales e historias sonoras en el aula. Hacia una docencia creativa mediante el uso de herramientas inteligentes

DPDETR: Decoupled Position Detection Transformer for Infrared-Visible Object Detection

Palantir: Towards Efficient Super Resolution for Ultra-high-definition Live Streaming

Rethinking Video with a Universal Event-Based Representation

Benchmarking Conventional and Learned Video Codecs with a Low-Delay Configuration

Loc4Plan: Locating Before Planning for Outdoor Vision and Language Navigation

最近の投稿

最近のコメント

アーカイブ

カテゴリー