eess.AS」カテゴリーアーカイブ

Self-consistent context aware conformer transducer for speech recognition

要約 我々は、ASR システムにコンテキスト情報フローを追加する配座異性体トラン … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Self-consistent context aware conformer transducer for speech recognition はコメントを受け付けていません

A Multi-Perspective Machine Learning Approach to Evaluate Police-Driver Interaction in Los Angeles

要約 政府職員と民間人の間の交流は、公共の福祉と民主主義社会の機能に必要な国家の … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.LG, eess.AS, I.2.0 | A Multi-Perspective Machine Learning Approach to Evaluate Police-Driver Interaction in Los Angeles はコメントを受け付けていません

Establishing degrees of closeness between audio recordings along different dimensions using large-scale cross-lingual models

要約 リソースが少ない言語研究という非常に制約されたコンテキストにおいて、事前学 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Establishing degrees of closeness between audio recordings along different dimensions using large-scale cross-lingual models はコメントを受け付けていません

Unified Speech-Text Pretraining for Spoken Dialog Modeling

要約 最近の研究では、音声を直接理解して合成するための大規模言語モデル (LLM … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Unified Speech-Text Pretraining for Spoken Dialog Modeling はコメントを受け付けていません

SpiRit-LM: Interleaved Spoken and Written Language Model

要約 テキストと音声を自由に混合する基礎マルチモーダル言語モデルである SPIR … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | SpiRit-LM: Interleaved Spoken and Written Language Model はコメントを受け付けていません

Integrating Self-supervised Speech Model with Pseudo Word-level Targets from Visually-grounded Speech Model

要約 自己教師あり音声モデルの最近の進歩により、多くの下流タスクで大幅な改善が見 … 続きを読む

カテゴリー: cs.CL, cs.LG, eess.AS | Integrating Self-supervised Speech Model with Pseudo Word-level Targets from Visually-grounded Speech Model はコメントを受け付けていません

A Multi-Perspective Machine Learning Approach to Evaluate Police-Driver Interaction in Los Angeles

要約 政府職員と民間人の間の交流は、公共の福祉と民主主義社会の機能に必要な国家の … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.LG, eess.AS, I.2.0 | A Multi-Perspective Machine Learning Approach to Evaluate Police-Driver Interaction in Los Angeles はコメントを受け付けていません

MERT: Acoustic Music Understanding Model with Large-Scale Self-supervised Training

要約 自己教師あり学習 (SSL) は、視覚、テキスト、および音声の分野の大規模 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | MERT: Acoustic Music Understanding Model with Large-Scale Self-supervised Training はコメントを受け付けていません

MusicRL: Aligning Music Generation to Human Preferences

要約 私たちは人間のフィードバックから微調整された初の音楽生成システム Musi … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | MusicRL: Aligning Music Generation to Human Preferences はコメントを受け付けていません

REBORN: Reinforcement-Learned Boundary Segmentation with Iterative Training for Unsupervised ASR

要約 教師なし自動音声認識 (ASR) は、音声とテキストのペアのデータを監視せ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | REBORN: Reinforcement-Learned Boundary Segmentation with Iterative Training for Unsupervised ASR はコメントを受け付けていません