-
最近の投稿
- FlowBotHD: History-Aware Diffuser Handling Ambiguities in Articulated Objects Manipulation
- A Novel Twisted-Winching String Actuator for Robotic Applications: Design and Validation
- Affordance-Centric Policy Learning: Sample Efficient and Generalisable Robot Policy Learning using Affordance-Centric Task Frames
- Sample-Efficient Reinforcement Learning with Temporal Logic Objectives: Leveraging the Task Specification to Guide Exploration
- Design Space Exploration of Embedded SoC Architectures for Real-Time Optimal Control
-
最近のコメント
表示できるコメントはありません。 cs.AI (28198) cs.CL (21301) cs.CR (2201) cs.CV (34856) cs.LG (32941) cs.RO (16224) cs.SY (2500) eess.IV (4250) eess.SY (2494) stat.ML (4412)
「eess.AS」カテゴリーアーカイブ
Hierarchical attention interpretation: an interpretable speech-level transformer for bi-modal depression detection
要約 うつ病は一般的な精神障害です。 機械学習によって実現された、音声を使用した … 続きを読む
Transferring speech-generic and depression-specific knowledge for Alzheimer’s disease detection
要約 自発的な発話からのアルツハイマー病 (AD) の検出はますます注目を集めて … 続きを読む
The North System for Formosa Speech Recognition Challenge 2023
要約 このレポートは、台湾の客家(六県)の単語/音節の自動認識を実現することを目 … 続きを読む
The North System for Formosa Speech Recognition Challenge 2023
要約 このレポートは、台湾の客家(六県)の単語/音節の自動認識を実現することを目 … 続きを読む
BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR
要約 最近提案されたシリアル化出力トレーニング (SOT) は、特殊なトークンで … 続きを読む
Evaluating Self-Supervised Speech Representations for Indigenous American Languages
要約 音声表現学習への自己監視の適用は、大量のラベルなしデータに対する拡張性によ … 続きを読む
Decoding speech perception from non-invasive brain recordings
要約 脳活動から音声を解読することは、医療と神経科学の両方において待望の目標です … 続きを読む
Self-supervised Neural Factor Analysis for Disentangling Utterance-level Speech Representations
要約 wav2vec や HuBERT などの自己教師あり学習 (SSL) 音声 … 続きを読む
Prompting and Adapter Tuning for Self-supervised Encoder-Decoder Speech Model
要約 プロンプトとアダプターのチューニングは、ファインチューニング (FT) 方 … 続きを読む
UniverSLU: Universal Spoken Language Understanding for Diverse Classification and Sequence Generation Tasks with a Single Network
要約 最近の研究では、マルチタスク機能を備えた大規模な言語モデルを採用することで … 続きを読む