cs.SD」カテゴリーアーカイブ

Simultaneous Interpretation Corpus Construction by Large Language Models in Distant Language Pair

要約 同時機械翻訳 (SiMT) システムでは、同時通訳 (SI) コーパスを使 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | Simultaneous Interpretation Corpus Construction by Large Language Models in Distant Language Pair はコメントを受け付けていません

Automatic Speech Recognition using Advanced Deep Learning Approaches: A survey

要約 深層学習 (DL) の最近の進歩により、自動音声認識 (ASR) にとって … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS, eess.SP | Automatic Speech Recognition using Advanced Deep Learning Approaches: A survey はコメントを受け付けていません

Dynamic Modality and View Selection for Multimodal Emotion Recognition with Missing Modalities

要約 人間の感情の研究は、伝統的に心理学や神経科学などの分野の基礎でしたが、人工 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | Dynamic Modality and View Selection for Multimodal Emotion Recognition with Missing Modalities はコメントを受け付けていません

The LuViRA Dataset: Measurement Description

要約 視覚、音声、無線センサーを利用した位置特定アルゴリズムを評価するためのデー … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS, eess.SP | The LuViRA Dataset: Measurement Description はコメントを受け付けていません

Tango 2: Aligning Diffusion-based Text-to-Audio Generations through Direct Preference Optimization

要約 ジェネレーティブ マルチモーダル コンテンツは、アーティストやメディア担当 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Tango 2: Aligning Diffusion-based Text-to-Audio Generations through Direct Preference Optimization はコメントを受け付けていません

Anatomy of Industrial Scale Multilingual ASR

要約 このペーパーでは、さまざまなアプリケーション ニーズに対応する大規模な多言 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Anatomy of Industrial Scale Multilingual ASR はコメントを受け付けていません

Llama-VITS: Enhancing TTS Synthesis with Semantic Awareness

要約 自然言語処理 (NLP) の最近の進歩により、大規模言語モデル (LLM) … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Llama-VITS: Enhancing TTS Synthesis with Semantic Awareness はコメントを受け付けていません

Differentiable All-pole Filters for Time-varying Audio Systems

要約 無限インパルス応答フィルターは、オーディオ エフェクトやシンセサイザーなど … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Differentiable All-pole Filters for Time-varying Audio Systems はコメントを受け付けていません

Differentiable All-pole Filters for Time-varying Audio Systems

要約 無限インパルス応答フィルターは、オーディオ エフェクトやシンセサイザーなど … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Differentiable All-pole Filters for Time-varying Audio Systems はコメントを受け付けていません

Audio Dialogues: Dialogues dataset for audio and music understanding

要約 音声理解のための既存のデータセットは、自然言語で音声を説明するためのシング … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Audio Dialogues: Dialogues dataset for audio and music understanding はコメントを受け付けていません