-
最近の投稿
- Simplified POMDP Planning with an Alternative Observation Space and Formal Performance Guarantees
- FREA: Feasibility-Guided Generation of Safety-Critical Scenarios with Reasonable Adversariality
- Enhanced Robot Planning and Perception through Environment Prediction
- FlowRetrieval: Flow-Guided Data Retrieval for Few-Shot Imitation Learning
- Energy-Cautious Designation of Kinematic Parameters for a Sustainable Parallel-Serial Heavy-Duty Manipulator Driven by Electromechanical Linear Actuator
-
最近のコメント
表示できるコメントはありません。 cs.AI (27989) cs.CL (21147) cs.CR (2187) cs.CV (34671) cs.LG (32719) cs.RO (16074) cs.SY (2489) eess.IV (4240) eess.SY (2483) stat.ML (4382)
「cs.MM」カテゴリーアーカイブ
Learning from Label Relationships in Human Affect
要約 自動化された方法での人間の影響と精神状態の推定は、多くの困難に直面します。 … 続きを読む
Late multimodal fusion for image and audio music transcription
要約 音楽ソースを構造化されたデジタル形式に変換する音楽のトランスクリプションは … 続きを読む
PPMN: Pixel-Phrase Matching Network for One-Stage Panoptic Narrative Grounding
要約 PNG(Panoptic Narrative Grounding)は、静止 … 続きを読む
PSUMNet: Unified Modality Part Streams are All You Need for Efficient Pose-based Action Recognition
要約 ポーズに基づくアクション認識は、入力スケルトンをモノリシックに扱うアプロー … 続きを読む
Seeing your sleep stage: cross-modal distillation from EEG to infrared video
要約 様々な疾患の診断には、睡眠段階の分類が不可欠である。しかし、既存の自動診断 … 続きを読む
Automatic Camera Control and Directing with an Ultra-High-Definition Collaborative Recording System
要約 ある出来事を複数のカメラで撮影すると、視聴者はその出来事の全体像を把握する … 続きを読む
Consistency-based Self-supervised Learning for Temporal Anomaly Localization
要約 この研究では、予測器が通常の例からだけでなく、学習中に利用可能になった少数 … 続きを読む
Language Supervised Training for Skeleton-based Action Recognition
要約 スケルトンに基づく行動認識は、その計算効率の高さと照明条件に対する頑健性か … 続きを読む
Boosting neural video codecs by exploiting hierarchical redundancy
要約 動画像圧縮では、動き補償や残差補償により、以前に復号されたフレームの画素を … 続きを読む
DnS: Distill-and-Select for Efficient and Accurate Video Indexing and Retrieval
要約 本論文では、大規模データセットにおける高性能かつ計算効率の高いコンテンツベ … 続きを読む