-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
Align-SLM: Textless Spoken Language Models with Reinforcement Learning from AI Feedback
要約 テキストレスの音声言語モデル(SLM)は、エンドツーエンドの音声からスピー … 続きを読む
Bridging The Multi-Modality Gaps of Audio, Visual and Linguistic for Speech Enhancement
要約 音声強化(SE)は、騒々しい環境での音声の品質と明瞭度を改善することを目的 … 続きを読む
DeepDialogue: A Multi-Turn Emotionally-Rich Spoken Dialogue Dataset
要約 会話型AIの最近の進歩は、単一ターン応答の印象的な能力を実証していますが、 … 続きを読む
Multi-modal brain encoding models for multi-modal stimuli
要約 画像やサイレントビデオを視聴するなどの単峰性刺激に従事している参加者にもか … 続きを読む
Automated data curation for self-supervised learning in underwater acoustic analysis
要約 海洋生態系の持続可能性は、健全な汚染のレベルの増加によって脅かされており、 … 続きを読む
Bemba Speech Translation: Exploring a Low-Resource African Language
要約 このホワイトペーパーでは、スポークン言語翻訳に関する国際会議(IWSLT … 続きを読む
MVP: Multi-source Voice Pathology detection
要約 音声障害は、患者の生活の質に大きな影響を与えますが、病的な音声データの希少 … 続きを読む
‘Alexa, can you forget me?’ Machine Unlearning Benchmark in Spoken Language Understanding
要約 機械学習モデルから特定の情報を効率的に削除するプロセスであるマシンの未学習 … 続きを読む
Exploring Generative Error Correction for Dysarthric Speech Recognition
要約 エンドツーエンドの自動音声認識(ASR)エンジンの驚くべき進歩にもかかわら … 続きを読む
‘KAN you hear me?’ Exploring Kolmogorov-Arnold Networks for Spoken Language Understanding
要約 Kolmogorov-Arnold Networks(KANS)は最近、従 … 続きを読む