投稿者「jarxiv」のアーカイブ

How to Select Pre-Trained Code Models for Reuse? A Learning Perspective

要約 言語モデルを事前トレーニングしてから微調整することは、コード生成、コード要 … 続きを読む

カテゴリー: cs.CL, cs.SE | How to Select Pre-Trained Code Models for Reuse? A Learning Perspective はコメントを受け付けていません

Detecting the Undetectable: Assessing the Efficacy of Current Spoof Detection Methods Against Seamless Speech Edits

要約 ニューラル音声編集の進歩により、なりすまし攻撃における悪用に対する懸念が生 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Detecting the Undetectable: Assessing the Efficacy of Current Spoof Detection Methods Against Seamless Speech Edits はコメントを受け付けていません

Investigating the Impact of Data Selection Strategies on Language Model Performance

要約 データの選択は、特にトレーニング データセットを目的のターゲット分布に合わ … 続きを読む

カテゴリー: cs.CL, cs.LG | Investigating the Impact of Data Selection Strategies on Language Model Performance はコメントを受け付けていません

Improving Speech Emotion Recognition in Under-Resourced Languages via Speech-to-Speech Translation with Bootstrapping Data Selection

要約 音声感情認識 (SER) は、人間とコンピューターの自然な対話が可能な汎用 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Improving Speech Emotion Recognition in Under-Resourced Languages via Speech-to-Speech Translation with Bootstrapping Data Selection はコメントを受け付けていません

BERTopic for Topic Modeling of Hindi Short Texts: A Comparative Study

要約 ヒンディー語などの母国語の短いテキスト データが現代のメディアに登場するこ … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.LG, H.2.8 | BERTopic for Topic Modeling of Hindi Short Texts: A Comparative Study はコメントを受け付けていません

BabyLMs for isiXhosa: Data-Efficient Language Modelling in a Low-Resource Context

要約 BabyLM チャレンジでは、サンプル効率の高い言語モデルを開発するよう参 … 続きを読む

カテゴリー: cs.CL | BabyLMs for isiXhosa: Data-Efficient Language Modelling in a Low-Resource Context はコメントを受け付けていません

Progressive Document-level Text Simplification via Large Language Models

要約 テキストの簡略化に関する研究は、主に語彙および文レベルの変更に焦点を当てて … 続きを読む

カテゴリー: cs.CL | Progressive Document-level Text Simplification via Large Language Models はコメントを受け付けていません

Improving Dialectal Slot and Intent Detection with Auxiliary Tasks: A Multi-Dialectal Bavarian Case Study

要約 信頼性の高いスロットおよびインテント検出 (SID) は、デジタル アシス … 続きを読む

カテゴリー: cs.CL | Improving Dialectal Slot and Intent Detection with Auxiliary Tasks: A Multi-Dialectal Bavarian Case Study はコメントを受け付けていません

The Faetar Benchmark: Speech Recognition in a Very Under-Resourced Language

要約 Faetar 自動音声認識ベンチマークを紹介します。これは、低リソースの音 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | The Faetar Benchmark: Speech Recognition in a Very Under-Resourced Language はコメントを受け付けていません

Add Noise, Tasks, or Layers? MaiNLP at the VarDial 2025 Shared Task on Norwegian Dialectal Slot and Intent Detection

要約 スロットおよびインテント検出 (SID) は、古典的な自然言語理解タスクで … 続きを読む

カテゴリー: cs.CL | Add Noise, Tasks, or Layers? MaiNLP at the VarDial 2025 Shared Task on Norwegian Dialectal Slot and Intent Detection はコメントを受け付けていません