-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「eess.AS」カテゴリーアーカイブ
NAAQA: A Neural Architecture for Acoustic Question Answering
要約 音響質問応答 (AQA) タスクの目標は、音響シーンの内容に関する自由形式 … 続きを読む
Learning Temporal Resolution in Spectrogram for Audio Classification
要約 オーディオ スペクトログラムは、オーディオの分類に広く使用されている時間と … 続きを読む
Visual Speech Recognition for Languages with Limited Labeled Data using Automatic Labels from Whisper
要約 この論文では、複数の言語、特にラベル付きデータの数が限られている低リソース … 続きを読む
Lip Reading for Low-resource Languages by Learning and Combining General Speech Knowledge and Language-specific Knowledge
要約 この論文は、これまでの文献では十分に取り上げられていなかった、特に低リソー … 続きを読む
Dynamic Behaviour of Connectionist Speech Recognition with Strong Latency Constraints
要約 この論文では、強力な遅延制約を伴う音声音声認識におけるコネクショニスト手法 … 続きを読む
Automated speech audiometry: Can it work using open-source pre-trained Kaldi-NL automatic speech recognition?
要約 実用的な音声聴力測定ツールは、さまざまな年齢や聴力状態の集団の聴力スクリー … 続きを読む
A-JEPA: Joint-Embedding Predictive Architecture Can Listen
要約 この論文では、大規模な基礎ビジョン モデルの成功を推進するマスク モデリン … 続きを読む
Real-time and Continuous Turn-taking Prediction Using Voice Activity Projection
要約 リアルタイムかつ継続的な方向転換予測システムのデモンストレーションが行われ … 続きを読む
Learning Audio Concepts from Counterfactual Natural Language
要約 従来の音声分類は事前定義されたクラスに依存しており、自由形式のテキストから … 続きを読む