-
最近の投稿
- Bayesian optimization for robust robotic grasping using a sensorized compliant hand
- Lessons from Learning to Spin ‘Pens’
- Uncertainty-Aware Planning for Heterogeneous Robot Teams using Dynamic Topological Graphs and Mixed-Integer Programming
- Screw Geometry Meets Bandits: Incremental Acquisition of Demonstrations to Generate Manipulation Plans
- Search-Based Path Planning among Movable Obstacles
-
最近のコメント
表示できるコメントはありません。 cs.AI (28604) cs.CL (21619) cs.CR (2231) cs.CV (35206) cs.LG (33368) cs.RO (16520) cs.SY (2542) eess.IV (4287) eess.SY (2536) stat.ML (4474)
「eess.AS」カテゴリーアーカイブ
ASiT: Audio Spectrogram vIsion Transformer for General Audio Representation
要約 もともと自然言語処理用に開発されたビジョン トランスフォーマーは、長期的な … 続きを読む
Masked Modeling Duo: Learning Representations by Encouraging Both Networks to Model the Input
要約 Masked Autoencoders は、シンプルでありながら強力な自己 … 続きを読む
Listen, denoise, action! Audio-driven motion synthesis with diffusion models
要約 拡散モデルは、表現力が高く効率的にトレーニング可能な確率モデルとして関心が … 続きを読む
FlowGrad: Using Motion for Visual Sound Source Localization
要約 視覚的な音源定位に関する最新の研究は、自己管理型の方法で学習されたセマンテ … 続きを読む
Investigating Modality Bias in Audio Visual Video Parsing
要約 オーディオとビジュアルのイベント ラベルを時間境界で検出することを含むオー … 続きを読む
On the role of Lip Articulation in Visual Speech Perception
要約 オーディオからリアルな唇の動きを生成して音声生成をシミュレートすることは、 … 続きを読む
A Multimodal Approach for Dementia Detection from Spontaneous Speech with Tensor Fusion Layer
要約 アルツハイマー病(AD)は進行性の神経疾患であり、長年にわたって徐々に症状 … 続きを読む
SPEAKER VGG CCT: Cross-corpus Speech Emotion Recognition with Speaker Embedding and Vision Transformers
要約 近年、音声感情認識(SER)は、音声信号をスペクトログラムに変換し、一般的 … 続きを読む
Artificial Intelligence for Suicide Assessment using Audiovisual Cues: A Review
要約 自殺による死亡は、世界第7位の死因である。近年の人工知能(AI)の進歩、特 … 続きを読む