-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
Is one brick enough to break the wall of spoken dialogue state tracking?
要約 タスク指向対話 (TOD) システムでは、ユーザーのニーズに対するシステム … 続きを読む
Iterative autoregression: a novel trick to improve your low-latency speech enhancement model
要約 ストリーミング モデルは、リアルタイム音声強調ツールの重要なコンポーネント … 続きを読む
Building Ears for Robots: Machine Hearing in the Age of Autonomy
要約 この研究では、ロボット聴覚システムの重要性を調査し、多様で不確実な環境で動 … 続きを読む
Building Ears for Robots: Machine Hearing in the Age of Autonomy
要約 不確実な環境におけるフィールドロボットの増加により、ロボットの聴覚システム … 続きを読む
Efficient Deep Speech Understanding at the Edge
要約 現代の音声理解(SU)では、ストリーミング音声入力の取り込みを含む高度なパ … 続きを読む
Exploring the Viability of Synthetic Audio Data for Audio-Based Dialogue State Tracking
要約 対話状態の追跡は、タスク指向の対話システムにおいて情報を抽出する上で重要な … 続きを読む
H_eval: A new hybrid evaluation metric for automatic speech recognition tasks
要約 自動音声認識(ASR)システムの評価指標としての単語誤り率(WER)の欠点 … 続きを読む
Unified Segment-to-Segment Framework for Simultaneous Sequence Generation
要約 同時シーケンス生成は、ストリーミング音声認識、同時機械翻訳、同時音声翻訳な … 続きを読む
CoDi-2: In-Context, Interleaved, and Interactive Any-to-Any Generation
要約 CoDi-2 は、複雑なマルチモーダルのインターリーブ命令に従い、コンテキ … 続きを読む
End-to-end Joint Rich and Normalized ASR with a limited amount of rich training data
要約 句読点や大文字を含む場合と含まない場合の両方の文字起こしを生成する、統合リ … 続きを読む