-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
Releasing the Parameter Latency of Neural Representation for High-Efficiency Video Compression
要約 何十年もの間、映像圧縮技術は著名な研究分野であった。従来のハイブリッド動画 … 続きを読む
Unleashing Parameter Potential of Neural Representation for Efficient Video Compression
要約 何十年もの間、ビデオ圧縮テクノロジーは著名な研究分野でした。 従来のハイブ … 続きを読む
RADAR: Robust Two-stage Modality-incomplete Industrial Anomaly Detection
要約 3D 点群と 2D RGB 画像を利用して製品の異常領域を特定するマルチモ … 続きを読む
SVFAP: Self-supervised Video Facial Affect Perceiver
要約 ビデオベースの顔の感情分析は、人間とコンピューターのインタラクションにおい … 続きを読む
FreeMask: Rethinking the Importance of Attention Masks for Zero-Shot Video Editing
要約 テキストからビデオへの普及モデルは目覚ましい進歩を遂げました。 時間的に一 … 続きを読む
Computer-mediated therapies for stroke rehabilitation: a systematic review and meta-Analysis
要約 目的: 脳卒中患者の身体的および心理的状態の改善における、従来の治療法 ( … 続きを読む
カテゴリー: cs.AI, cs.HC, cs.MM, J.3.2, physics.med-ph
Computer-mediated therapies for stroke rehabilitation: a systematic review and meta-Analysis はコメントを受け付けていません
Semi-Supervised Cognitive State Classification from Speech with Multi-View Pseudo-Labeling
要約 ラベル付きデータの欠如は、音声分類タスク、特に認知状態分類などの広範な主観 … 続きを読む
Rethinking Emotion Bias in Music via Frechet Audio Distance
要約 音楽の感情の主観的な性質により、特に単一のオーディオ エンコーダー、感情分 … 続きを読む
Beyond Single-Audio: Advancing Multi-Audio Processing in Audio Large Language Models
要約 最近、単一の統合モデルを使用してさまざまなオーディオ タスクに同時に取り組 … 続きを読む