月別アーカイブ: 2025年1月

Towards Expressive Video Dubbing with Multiscale Multimodal Context Interaction

要約 自動ビデオ ダビング (AVD) は、スクリプトから唇の動きと顔の感情に合 … 続きを読む

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | Towards Expressive Video Dubbing with Multiscale Multimodal Context Interaction はコメントを受け付けていません

AnglE-optimized Text Embeddings

要約 高品質のテキスト埋め込みは、大規模言語モデル (LLM) アプリケーション … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | AnglE-optimized Text Embeddings はコメントを受け付けていません

Text2midi: Generating Symbolic Music from Captions

要約 この文書では、テキスト記述から MIDI ファイルを生成するエンドツーエン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Text2midi: Generating Symbolic Music from Captions はコメントを受け付けていません

DiSHA: Dimension-Sharding Adaptation with Fast Convergence and Fast Computation

要約 低ランク適応 (LoRA) は、大規模言語モデル (LLM) の重み更新の … 続きを読む

カテゴリー: cs.AI, cs.CL | DiSHA: Dimension-Sharding Adaptation with Fast Convergence and Fast Computation はコメントを受け付けていません

Benchmarking the Performance of Pre-trained LLMs across Urdu NLP Tasks

要約 多言語データで事前トレーニングされた大規模言語モデル (LLM) は、言語 … 続きを読む

カテゴリー: cs.AI, cs.CL, I.2.7 | Benchmarking the Performance of Pre-trained LLMs across Urdu NLP Tasks はコメントを受け付けていません

Can Large Audio-Language Models Truly Hear? Tackling Hallucinations with Multi-Task Assessment and Stepwise Audio Reasoning

要約 大規模音声言語モデル (LALM) の最近の進歩により、音声および音声情報 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Can Large Audio-Language Models Truly Hear? Tackling Hallucinations with Multi-Task Assessment and Stepwise Audio Reasoning はコメントを受け付けていません

MaLei at the PLABA Track of TAC-2024: RoBERTa for Task 1 — LLaMA3.1 and GPT-4o for Task 2

要約 このレポートは、共有タスク「Plain Language Adaptati … 続きを読む

カテゴリー: cs.CL | MaLei at the PLABA Track of TAC-2024: RoBERTa for Task 1 — LLaMA3.1 and GPT-4o for Task 2 はコメントを受け付けていません

An investigation of phrase break prediction in an End-to-End TTS system

要約 目的: この研究では、エンドツーエンドの Text-to-Speech ( … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | An investigation of phrase break prediction in an End-to-End TTS system はコメントを受け付けていません

UPCS: Unbiased Persona Construction for Dialogue Generation

要約 対話システムやストーリーテリング システムなどのナラティブ システムでは、 … 続きを読む

カテゴリー: cs.CL | UPCS: Unbiased Persona Construction for Dialogue Generation はコメントを受け付けていません

Mathematical Language Models: A Survey

要約 近年、数学の領域内で、事前トレーニング済み言語モデル (PLM) と大規模 … 続きを読む

カテゴリー: cs.CL | Mathematical Language Models: A Survey はコメントを受け付けていません