-
最近の投稿
- Scaling Multi Agent Reinforcement Learning for Underwater Acoustic Tracking via Autonomous Vehicles
- Reinforcement Learning-based Fault-Tolerant Control for Quadrotor with Online Transformer Adaptation
- Enhanced Importance Sampling through Latent Space Exploration in Normalizing Flows
- Enhancing Scene Coordinate Regression with Efficient Keypoint Detection and Sequential Information
- Constrained Factor Graph Optimization for Robust Networked Pedestrian Inertial Navigation
-
最近のコメント
表示できるコメントはありません。 cs.AI (38035) cs.CL (28747) cs.CV (43624) cs.HC (2908) cs.LG (42962) cs.RO (22623) cs.SY (3469) eess.IV (5057) eess.SY (3461) stat.ML (5597)
「cs.MM」カテゴリーアーカイブ
FastPerson: Enhancing Video Learning through Effective Video Summarization that Preserves Linguistic and Visual Contexts
要約 時間が限られており、さまざまなトピックに興味がある学習者にとって、学習効率 … 続きを読む
GTA-HDR: A Large-Scale Synthetic Dataset for HDR Image Reconstruction
要約 ハイ ダイナミック レンジ (HDR) コンテンツ (つまり、画像やビデオ … 続きを読む
カテゴリー: Computer vision, cs.CV, cs.GR, cs.LG, cs.MM, Deep learning, eess.IV, I.3.3
GTA-HDR: A Large-Scale Synthetic Dataset for HDR Image Reconstruction はコメントを受け付けていません
Boosting Diffusion Models with Moving Average Sampling in Frequency Domain
要約 拡散モデルは最近、画像生成に強力な革命をもたらしました。 これらのモデルの … 続きを読む
Unraveling Instance Associations: A Closer Look for Audio-Visual Segmentation
要約 視聴覚セグメンテーション (AVS) は、視聴覚キューに基づいて音を発する … 続きを読む
Not All Attention is Needed: Parameter and Computation Efficient Transfer Learning for Multi-modal Large Language Models
要約 この論文では、効率的注意スキッピング (EAS) と呼ばれる、マルチモーダ … 続きを読む
FunQA: Towards Surprising Video Comprehension
要約 面白いクリップ、創造的なパフォーマンス、視覚的な錯覚など、驚くべきビデオは … 続きを読む
MSAC: Multiple Speech Attribute Control Method for Reliable Speech Emotion Recognition
要約 顕著な進歩にもかかわらず、音声感情認識 (SER) は、特に野生の世界では … 続きを読む
AnyV2V: A Plug-and-Play Framework For Any Video-to-Video Editing Tasks
要約 ビデオ間の編集には、ソース ビデオを追加のコントロール (テキスト プロン … 続きを読む
Bringing Robots Home: The Rise of AI Robots in Consumer Electronics
要約 2024 年 3 月 18 日、NVIDIA は、人型ロボットのトレーニン … 続きを読む
AnyV2V: A Plug-and-Play Framework For Any Video-to-Video Editing Tasks
要約 ビデオ間の編集には、ソース ビデオを追加のコントロール (テキスト プロン … 続きを読む