投稿者「jarxiv」のアーカイブ

Swiss Parliaments Corpus Re-Imagined (SPC_R): Enhanced Transcription with RAG-based Correction and Predicted BLEU

要約 このペーパーでは、スイスの議員コーパスの新しい長期のリリースを紹介し、複数 … 続きを読む

カテゴリー: cs.CL | Swiss Parliaments Corpus Re-Imagined (SPC_R): Enhanced Transcription with RAG-based Correction and Predicted BLEU はコメントを受け付けていません

Augmenting LLMs’ Reasoning by Reinforcing Abstract Thinking

要約 最近の研究では、大規模な言語モデル(LLM)、特に小さな言語モデルは、多く … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SC | Augmenting LLMs’ Reasoning by Reinforcing Abstract Thinking はコメントを受け付けていません

Is poisoning a real threat to LLM alignment? Maybe more so than you think

要約 人間のフィードバック(RLHF)による強化学習の最近の進歩は、大規模な言語 … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | Is poisoning a real threat to LLM alignment? Maybe more so than you think はコメントを受け付けていません

LLM Unlearning Should Be Form-Independent

要約 大規模な言語モデル(LLM)は、モデル内の望ましくない知識を消去または抑制 … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | LLM Unlearning Should Be Form-Independent はコメントを受け付けていません

Generalized Interpolating Discrete Diffusion

要約 最先端の言語モデルは次のトークン予測を通じて印象的な結果を達成しますが、す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Generalized Interpolating Discrete Diffusion はコメントを受け付けていません

MultiMatch: Multihead Consistency Regularization Matching for Semi-Supervised Text Classification

要約 擬似標識との共同トレーニングと一貫性の正規化のパラダイムを組み合わせた新し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, I.2.7 | MultiMatch: Multihead Consistency Regularization Matching for Semi-Supervised Text Classification はコメントを受け付けていません

Minerva: A Programmable Memory Test Benchmark for Language Models

要約 LLMベースのAIアシスタントは、メモリ(コンテキスト)をどの程度効果的に … 続きを読む

カテゴリー: cs.CL | Minerva: A Programmable Memory Test Benchmark for Language Models はコメントを受け付けていません

WeQA: A Benchmark for Retrieval Augmented Generation in Wind Energy Domain

要約 Wind Energy Project Assessmentは、意思決定者 … 続きを読む

カテゴリー: cs.CL | WeQA: A Benchmark for Retrieval Augmented Generation in Wind Energy Domain はコメントを受け付けていません

ConECT Dataset: Overcoming Data Scarcity in Context-Aware E-Commerce MT

要約 ニューラルマシン翻訳(NMT)は、変圧器ベースのモデルを使用することで翻訳 … 続きを読む

カテゴリー: cs.CL | ConECT Dataset: Overcoming Data Scarcity in Context-Aware E-Commerce MT はコメントを受け付けていません

WebUIBench: A Comprehensive Benchmark for Evaluating Multimodal Large Language Models in WebUI-to-Code

要約 生成AIテクノロジーの急速な進歩により、マルチモーダルラージランゲージモデ … 続きを読む

カテゴリー: cs.CL | WebUIBench: A Comprehensive Benchmark for Evaluating Multimodal Large Language Models in WebUI-to-Code はコメントを受け付けていません