-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
Disentangling Aesthetic and Technical Effects for Video Quality Assessment of User Generated Content
要約 近年、ユーザー生成コンテンツ (UGC) ビデオがインターネットを支配して … 続きを読む
Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval
要約 マルチメディア情報検索でますます一般的なタスクとして、ビデオ モーメント検 … 続きを読む
FlowGrad: Using Motion for Visual Sound Source Localization
要約 視覚的な音源定位に関する最新の研究は、自己管理型の方法で学習されたセマンテ … 続きを読む
AI4Food-NutritionDB: Food Image Database, Nutrition Taxonomy, and Recognition Benchmark
要約 健康的なライフスタイルをリードすることは、座りっぱなしのライフスタイルと貧 … 続きを読む
Investigating Modality Bias in Audio Visual Video Parsing
要約 オーディオとビジュアルのイベント ラベルを時間境界で検出することを含むオー … 続きを読む
DrawMon: A Distributed System for Detection of Atypical Sketch Content in Concurrent Pictionary Games
要約 人気のあるスケッチ ベースの推測ゲームである Pictionary は、制 … 続きを読む
MMDialog: A Large-scale Multi-turn Dialogue Dataset Towards Multi-modal Open-domain Conversation
要約 マルチモーダル コンテンツで応答することは、インテリジェントな会話型エージ … 続きを読む
Disentangling Aesthetic and Technical Effects for Video Quality Assessment of User Generated Content
要約 近年、UGC(User-Generated-Content)動画がインター … 続きを読む
Using Set Covering to Generate Databases for Holistic Steganalysis
要約 運用フレームワークの中で、ステガノグラファーが使用するカバーは、研究者がス … 続きを読む