-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
Seeing your sleep stage: cross-modal distillation from EEG to infrared video
要約 様々な疾患の診断には、睡眠段階の分類が不可欠である。しかし、既存の自動診断 … 続きを読む
Automatic Camera Control and Directing with an Ultra-High-Definition Collaborative Recording System
要約 ある出来事を複数のカメラで撮影すると、視聴者はその出来事の全体像を把握する … 続きを読む
Consistency-based Self-supervised Learning for Temporal Anomaly Localization
要約 この研究では、予測器が通常の例からだけでなく、学習中に利用可能になった少数 … 続きを読む
Language Supervised Training for Skeleton-based Action Recognition
要約 スケルトンに基づく行動認識は、その計算効率の高さと照明条件に対する頑健性か … 続きを読む
Boosting neural video codecs by exploiting hierarchical redundancy
要約 動画像圧縮では、動き補償や残差補償により、以前に復号されたフレームの画素を … 続きを読む
DnS: Distill-and-Select for Efficient and Accurate Video Indexing and Retrieval
要約 本論文では、大規模データセットにおける高性能かつ計算効率の高いコンテンツベ … 続きを読む
IPDAE: Improved Patch-Based Deep Autoencoder for Lossy Point Cloud Geometry Compression
要約 点群は3次元コンテンツの重要な表現であり、バーチャルリアリティ、複合現実感 … 続きを読む
Causal Reasoning Meets Visual Representation Learning: A Prospective Study
要約 視覚表現学習は、視覚理解、ビデオ理解、マルチモーダル分析、ヒューマン コン … 続きを読む
Unified Normalization for Accelerating and Stabilizing Transformers
要約 Transformers の堅実な成果により、Transformer はさ … 続きを読む
Shadow-Aware Dynamic Convolution for Shadow Removal
要約 多くの収集された画像に広範囲の影があるため、多くのダウンストリーム マルチ … 続きを読む