eess.AS」カテゴリーアーカイブ

Is one brick enough to break the wall of spoken dialogue state tracking?

要約 タスク指向対話 (TOD) システムでは、ユーザーのニーズに対するシステム … 続きを読む

カテゴリー: cs.AI, cs.CL, eess.AS, eess.SP | Is one brick enough to break the wall of spoken dialogue state tracking? はコメントを受け付けていません

Iterative autoregression: a novel trick to improve your low-latency speech enhancement model

要約 ストリーミング モデルは、リアルタイム音声強調ツールの重要なコンポーネント … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Iterative autoregression: a novel trick to improve your low-latency speech enhancement model はコメントを受け付けていません

Building Ears for Robots: Machine Hearing in the Age of Autonomy

要約 この研究では、ロボット聴覚システムの重要性を調査し、多様で不確実な環境で動 … 続きを読む

カテゴリー: cs.RO, cs.SD, eess.AS | Building Ears for Robots: Machine Hearing in the Age of Autonomy はコメントを受け付けていません

Building Ears for Robots: Machine Hearing in the Age of Autonomy

要約 不確実な環境におけるフィールドロボットの増加により、ロボットの聴覚システム … 続きを読む

カテゴリー: cs.RO, cs.SD, eess.AS | Building Ears for Robots: Machine Hearing in the Age of Autonomy はコメントを受け付けていません

Efficient Deep Speech Understanding at the Edge

要約 現代の音声理解(SU)では、ストリーミング音声入力の取り込みを含む高度なパ … 続きを読む

カテゴリー: cs.CL, cs.LG, eess.AS | Efficient Deep Speech Understanding at the Edge はコメントを受け付けていません

Exploring the Viability of Synthetic Audio Data for Audio-Based Dialogue State Tracking

要約 対話状態の追跡は、タスク指向の対話システムにおいて情報を抽出する上で重要な … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Exploring the Viability of Synthetic Audio Data for Audio-Based Dialogue State Tracking はコメントを受け付けていません

H_eval: A new hybrid evaluation metric for automatic speech recognition tasks

要約 自動音声認識(ASR)システムの評価指標としての単語誤り率(WER)の欠点 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | H_eval: A new hybrid evaluation metric for automatic speech recognition tasks はコメントを受け付けていません

Unified Segment-to-Segment Framework for Simultaneous Sequence Generation

要約 同時シーケンス生成は、ストリーミング音声認識、同時機械翻訳、同時音声翻訳な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Unified Segment-to-Segment Framework for Simultaneous Sequence Generation はコメントを受け付けていません

CoDi-2: In-Context, Interleaved, and Interactive Any-to-Any Generation

要約 CoDi-2 は、複雑なマルチモーダルのインターリーブ命令に従い、コンテキ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.SD, eess.AS | CoDi-2: In-Context, Interleaved, and Interactive Any-to-Any Generation はコメントを受け付けていません

End-to-end Joint Rich and Normalized ASR with a limited amount of rich training data

要約 句読点や大文字を含む場合と含まない場合の両方の文字起こしを生成する、統合リ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | End-to-end Joint Rich and Normalized ASR with a limited amount of rich training data はコメントを受け付けていません