-
最近の投稿
- Adaptive Discretization against an Adversary: Lipschitz bandits, Dynamic Pricing, and Auction Tuning
- Cybernetic Marionette: Channeling Collective Agency Through a Wearable Robot in a Live Dancer-Robot Duet
- Leveraging LLMs for Mission Planning in Precision Agriculture
- Estimating the Joint Probability of Scenario Parameters with Gaussian Mixture Copula Models
- One For All: LLM-based Heterogeneous Mission Planning in Precision Agriculture
-
最近のコメント
表示できるコメントはありません。 cs.AI (39605) cs.CL (29980) cs.CV (44945) cs.HC (3015) cs.LG (44542) cs.RO (23689) cs.SY (3609) eess.IV (5149) eess.SY (3601) stat.ML (5788)
「eess.AS」カテゴリーアーカイブ
Analyzing the relationships between pretraining language, phonetic, tonal, and speaker information in self-supervised speech models
要約 自己教師の音声モデルの分析は、さまざまな種類の情報をどこでどのように表現す … 続きを読む
UmbraTTS: Adapting Text-to-Speech to Environmental Contexts with Flow Matching
要約 テキストからスピーチ(TTS)の最近の進歩により、非常に自然な音声統合が可 … 続きを読む
Fine-Tuning Large Audio-Language Models with LoRA for Precise Temporal Localization of Prolonged Exposure Therapy Elements
要約 長期曝露(PE)療法は、心的外傷後ストレス障害(PTSD)の効果的な治療法 … 続きを読む
Regularizing Learnable Feature Extraction for Automatic Speech Recognition
要約 ニューラルフロントエンドは、音響モデルに適合するように直接訓練できるため、 … 続きを読む
Teaching Physical Awareness to LLMs through Sounds
要約 大規模な言語モデル(LLM)は、テキストとマルチモーダル処理に顕著な能力を … 続きを読む
Teaching Physical Awareness to LLMs through Sounds
要約 大規模な言語モデル(LLM)は、テキストとマルチモーダル処理に顕著な能力を … 続きを読む
Step-Audio-AQAA: a Fully End-to-End Expressive Large Audio Language Model
要約 大規模なオーディオ言語モデル(LALMS)は、インテリジェントなヒューマン … 続きを読む
W4S4: WaLRUS Meets S4 for Long-Range Sequence Modeling
要約 状態空間モデル(SSM)は、シーケンスモデリングの強力なコンポーネントとし … 続きを読む
Dynamic-SUPERB Phase-2: A Collaboratively Expanding Benchmark for Measuring the Capabilities of Spoken Language Models with 180 Tasks
要約 GeminiやChatGptなどのマルチモーダルファンデーションモデルは、 … 続きを読む
CO-VADA: A Confidence-Oriented Voice Augmentation Debiasing Approach for Fair Speech Emotion Recognition
要約 音声感情認識(SER)システムのバイアスは、多くの場合、スピーカーの特性と … 続きを読む