cs.CL」カテゴリーアーカイブ

Language Complexity and Speech Recognition Accuracy: Orthographic Complexity Hurts, Phonological Complexity Doesn’t

要約 どのような言語的要因が自動音声認識 (ASR) モデルのパフォーマンスに影 … 続きを読む

カテゴリー: cs.AI, cs.CL | Language Complexity and Speech Recognition Accuracy: Orthographic Complexity Hurts, Phonological Complexity Doesn’t はコメントを受け付けていません

MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI

要約 MMMU を紹介します。MMMU は、大学レベルの主題知識と慎重な推論を必 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI はコメントを受け付けていません

ReadCtrl: Personalizing text generation with readability-controlled instruction learning

要約 ユーザーの読みやすさを条件にしたコンテンツ生成は、パーソナライゼーションの … 続きを読む

カテゴリー: cs.AI, cs.CL | ReadCtrl: Personalizing text generation with readability-controlled instruction learning はコメントを受け付けていません

Active Learning for Multilingual Fingerspelling Corpora

要約 私たちはアクティブ ラーニングを適用して、手話のデータ不足の問題を解決しま … 続きを読む

カテゴリー: cs.CL, cs.CV | Active Learning for Multilingual Fingerspelling Corpora はコメントを受け付けていません

Self-Training for Sample-Efficient Active Learning for Text Classification with Pre-Trained Language Models

要約 アクティブ ラーニングは、ラベル付きデータがないにもかかわらず、ラベル付き … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Self-Training for Sample-Efficient Active Learning for Text Classification with Pre-Trained Language Models はコメントを受け付けていません

Sharing Matters: Analysing Neurons Across Languages and Tasks in LLMs

要約 多言語大規模言語モデル (LLM) により、英語以外のタスクのパフォーマン … 続きを読む

カテゴリー: cs.CL | Sharing Matters: Analysing Neurons Across Languages and Tasks in LLMs はコメントを受け付けていません

End-to-end Streaming model for Low-Latency Speech Anonymization

要約 話者の匿名化は、言語コンテンツを保持しながら話者の身元を示す手がかりを隠す … 続きを読む

カテゴリー: cs.CL, cs.LG, eess.AS | End-to-end Streaming model for Low-Latency Speech Anonymization はコメントを受け付けていません

Unpacking DPO and PPO: Disentangling Best Practices for Learning from Preference Feedback

要約 好みのフィードバックから学習することは、最新の言語モデル (LM) の生成 … 続きを読む

カテゴリー: cs.CL | Unpacking DPO and PPO: Disentangling Best Practices for Learning from Preference Feedback はコメントを受け付けていません

On the Effects of Heterogeneous Data Sources on Speech-to-Text Foundation Models

要約 Open Whisper-style Speech Model (OWSM … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | On the Effects of Heterogeneous Data Sources on Speech-to-Text Foundation Models はコメントを受け付けていません

RTF: Region-based Table Filling Method for Relational Triple Extraction

要約 リレーショナル トリプル抽出は、ナレッジ グラフの自動構築にとって重要な作 … 続きを読む

カテゴリー: cs.CL | RTF: Region-based Table Filling Method for Relational Triple Extraction はコメントを受け付けていません