「cs.MM」カテゴリーアーカイブ

Latent Multimodal Reconstruction for Misinformation Detection

投稿日: 2025年4月9日作成者: jarxiv

要約キャプションが画像の起源、コンテキスト、または意味を誤って伝えた誤った画像 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Agent Journey Beyond RGB: Unveiling Hybrid Semantic-Spatial Environmental Representations for Vision-and-Language Navigation

投稿日: 2025年4月8日作成者: jarxiv

要約自然言語の指示に基づいて目に見えない環境をナビゲートすることは、視覚航海航 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

NeRFlex: Resource-aware Real-time High-quality Rendering of Complex Scenes on Mobile Devices

投稿日: 2025年4月7日作成者: jarxiv

要約 Neural Radiance Fields（NeRF）は、3D再構成にお … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG, cs.MM, cs.PF | コメントを受け付けていません

EVOS: Efficient Implicit Neural Training via EVOlutionary Selector

投稿日: 2025年4月7日作成者: jarxiv

要約我々は、陰的神経表現(INR)を高速化するための効率的な学習パラダイムであ … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.NE | コメントを受け付けていません

AutoSSVH: Exploring Automated Frame Sampling for Efficient Self-Supervised Video Hashing

投稿日: 2025年4月7日作成者: jarxiv

要約 Self-Supervised Video Hashing (SSVH)は … 続きを読む →

カテゴリー: cs.CV, cs.IR, cs.MM | コメントを受け付けていません

L-LBVC: Long-Term Motion Estimation and Prediction for Learned Bi-Directional Video Compression

投稿日: 2025年4月4日作成者: jarxiv

要約近年、学習型ビデオ圧縮(LVC)が低遅延構成で優れた性能を示すようになった … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

FortisAVQA and MAVEN: a Benchmark Dataset and Debiasing Framework for Robust Multimodal Reasoning

投稿日: 2025年4月3日作成者: jarxiv

要約オーディオビジュアル質問応答（AVQA）は、ペアのオーディオビデオ入力に基 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.MM, H.5.1 | コメントを受け付けていません

EVOS: Efficient Implicit Neural Training via EVOlutionary Selector

投稿日: 2025年4月3日作成者: jarxiv

要約暗黙の神経表現（INR）を加速するための効率的なトレーニングパラダイムであ … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.NE | コメントを受け付けていません

TeleAntiFraud-28k: An Audio-Text Slow-Thinking Dataset for Telecom Fraud Detection

投稿日: 2025年4月3日作成者: jarxiv

要約通信詐欺の検出は、オーディオ信号を推論指向のテキスト分析と統合する高品質の … 続きを読む →

カテゴリー: cs.CL, cs.MM | コメントを受け付けていません

TeleAntiFraud-28k: An Audio-Text Slow-Thinking Dataset for Telecom Fraud Detection

投稿日: 2025年4月2日作成者: jarxiv

要約通信詐欺の検出は、オーディオ信号を推論指向のテキスト分析と統合する高品質の … 続きを読む →

カテゴリー: cs.CL, cs.MM | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

Latent Multimodal Reconstruction for Misinformation Detection

Agent Journey Beyond RGB: Unveiling Hybrid Semantic-Spatial Environmental Representations for Vision-and-Language Navigation

NeRFlex: Resource-aware Real-time High-quality Rendering of Complex Scenes on Mobile Devices

EVOS: Efficient Implicit Neural Training via EVOlutionary Selector

AutoSSVH: Exploring Automated Frame Sampling for Efficient Self-Supervised Video Hashing

L-LBVC: Long-Term Motion Estimation and Prediction for Learned Bi-Directional Video Compression

FortisAVQA and MAVEN: a Benchmark Dataset and Debiasing Framework for Robust Multimodal Reasoning

EVOS: Efficient Implicit Neural Training via EVOlutionary Selector

TeleAntiFraud-28k: An Audio-Text Slow-Thinking Dataset for Telecom Fraud Detection

TeleAntiFraud-28k: An Audio-Text Slow-Thinking Dataset for Telecom Fraud Detection

最近の投稿

最近のコメント

アーカイブ

カテゴリー