-
最近の投稿
- Simplified POMDP Planning with an Alternative Observation Space and Formal Performance Guarantees
- FREA: Feasibility-Guided Generation of Safety-Critical Scenarios with Reasonable Adversariality
- Enhanced Robot Planning and Perception through Environment Prediction
- FlowRetrieval: Flow-Guided Data Retrieval for Few-Shot Imitation Learning
- Energy-Cautious Designation of Kinematic Parameters for a Sustainable Parallel-Serial Heavy-Duty Manipulator Driven by Electromechanical Linear Actuator
-
最近のコメント
表示できるコメントはありません。 cs.AI (27989) cs.CL (21147) cs.CR (2187) cs.CV (34671) cs.LG (32719) cs.RO (16074) cs.SY (2489) eess.IV (4240) eess.SY (2483) stat.ML (4382)
「cs.MM」カテゴリーアーカイブ
IPDAE: Improved Patch-Based Deep Autoencoder for Lossy Point Cloud Geometry Compression
要約 点群は3次元コンテンツの重要な表現であり、バーチャルリアリティ、複合現実感 … 続きを読む
Causal Reasoning Meets Visual Representation Learning: A Prospective Study
要約 視覚表現学習は、視覚理解、ビデオ理解、マルチモーダル分析、ヒューマン コン … 続きを読む
Unified Normalization for Accelerating and Stabilizing Transformers
要約 Transformers の堅実な成果により、Transformer はさ … 続きを読む
Shadow-Aware Dynamic Convolution for Shadow Removal
要約 多くの収集された画像に広範囲の影があるため、多くのダウンストリーム マルチ … 続きを読む
ALADIN: Distilling Fine-grained Alignment Scores for Efficient Image-Text Matching and Retrieval
要約 画像とテキストのマッチングは、視覚と言語の共同理解を伴うタスクの中で主導的 … 続きを読む
CubeMLP: A MLP-based Model for Multimodal Sentiment Analysis and Depression Estimation
要約 マルチモーダル感情分析とうつ病推定は、マルチモーダルデータを使用して人間の … 続きを読む
Content-oriented learned image compression
要約 近年、ディープニューラルネットワークの開発により、エンドツーエンドで最適化 … 続きを読む
End-To-End Audiovisual Feature Fusion for Active Speaker Detection
要約 アクティブスピーカー検出は、人間と機械の相互作用において重要な役割を果たし … 続きを読む
VICTOR: Visual Incompatibility Detection with Transformers and Fashion-specific contrastive pre-training
要約 ファッションの服装を美的に心地よいものと見なすためには、それらを構成する衣 … 続きを読む
AutoTransition: Learning to Recommend Video Transition Effects
要約 ビデオトランジションエフェクトは、ビデオ編集で広く使用されており、ショット … 続きを読む