「cs.CL」カテゴリーアーカイブ

Language Complexity and Speech Recognition Accuracy: Orthographic Complexity Hurts, Phonological Complexity Doesn’t

投稿日: 2024年6月14日作成者: jarxiv

要約どのような言語的要因が自動音声認識 (ASR) モデルのパフォーマンスに影 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI

投稿日: 2024年6月14日作成者: jarxiv

要約 MMMU を紹介します。MMMU は、大学レベルの主題知識と慎重な推論を必 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

ReadCtrl: Personalizing text generation with readability-controlled instruction learning

投稿日: 2024年6月14日作成者: jarxiv

要約ユーザーの読みやすさを条件にしたコンテンツ生成は、パーソナライゼーションの … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Active Learning for Multilingual Fingerspelling Corpora

投稿日: 2024年6月14日作成者: jarxiv

要約私たちはアクティブラーニングを適用して、手話のデータ不足の問題を解決しま … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Self-Training for Sample-Efficient Active Learning for Text Classification with Pre-Trained Language Models

投稿日: 2024年6月14日作成者: jarxiv

要約アクティブラーニングは、ラベル付きデータがないにもかかわらず、ラベル付き … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Sharing Matters: Analysing Neurons Across Languages and Tasks in LLMs

投稿日: 2024年6月14日作成者: jarxiv

要約多言語大規模言語モデル (LLM) により、英語以外のタスクのパフォーマン … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

End-to-end Streaming model for Low-Latency Speech Anonymization

投稿日: 2024年6月14日作成者: jarxiv

要約話者の匿名化は、言語コンテンツを保持しながら話者の身元を示す手がかりを隠す … 続きを読む →

カテゴリー: cs.CL, cs.LG, eess.AS | コメントを受け付けていません

Unpacking DPO and PPO: Disentangling Best Practices for Learning from Preference Feedback

投稿日: 2024年6月14日作成者: jarxiv

要約好みのフィードバックから学習することは、最新の言語モデル (LM) の生成 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

On the Effects of Heterogeneous Data Sources on Speech-to-Text Foundation Models

投稿日: 2024年6月14日作成者: jarxiv

要約 Open Whisper-style Speech Model (OWSM … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

RTF: Region-based Table Filling Method for Relational Triple Extraction

投稿日: 2024年6月14日作成者: jarxiv

要約リレーショナルトリプル抽出は、ナレッジグラフの自動構築にとって重要な作 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Language Complexity and Speech Recognition Accuracy: Orthographic Complexity Hurts, Phonological Complexity Doesn’t

MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI

ReadCtrl: Personalizing text generation with readability-controlled instruction learning

Active Learning for Multilingual Fingerspelling Corpora

Self-Training for Sample-Efficient Active Learning for Text Classification with Pre-Trained Language Models

Sharing Matters: Analysing Neurons Across Languages and Tasks in LLMs

End-to-end Streaming model for Low-Latency Speech Anonymization

Unpacking DPO and PPO: Disentangling Best Practices for Learning from Preference Feedback

On the Effects of Heterogeneous Data Sources on Speech-to-Text Foundation Models

RTF: Region-based Table Filling Method for Relational Triple Extraction

最近の投稿

最近のコメント

アーカイブ

カテゴリー