投稿者「jarxiv」のアーカイブ

Swiss Parliaments Corpus Re-Imagined (SPC_R): Enhanced Transcription with RAG-based Correction and Predicted BLEU

投稿日: 2025年6月10日作成者: jarxiv

要約このペーパーでは、スイスの議員コーパスの新しい長期のリリースを紹介し、複数 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Augmenting LLMs’ Reasoning by Reinforcing Abstract Thinking

投稿日: 2025年6月10日作成者: jarxiv

要約最近の研究では、大規模な言語モデル（LLM）、特に小さな言語モデルは、多く … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SC | コメントを受け付けていません

Is poisoning a real threat to LLM alignment? Maybe more so than you think

投稿日: 2025年6月10日作成者: jarxiv

要約人間のフィードバック（RLHF）による強化学習の最近の進歩は、大規模な言語 … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.LG | コメントを受け付けていません

LLM Unlearning Should Be Form-Independent

投稿日: 2025年6月10日作成者: jarxiv

要約大規模な言語モデル（LLM）は、モデル内の望ましくない知識を消去または抑制 … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.LG | コメントを受け付けていません

Generalized Interpolating Discrete Diffusion

投稿日: 2025年6月10日作成者: jarxiv

要約最先端の言語モデルは次のトークン予測を通じて印象的な結果を達成しますが、す … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

MultiMatch: Multihead Consistency Regularization Matching for Semi-Supervised Text Classification

投稿日: 2025年6月10日作成者: jarxiv

要約擬似標識との共同トレーニングと一貫性の正規化のパラダイムを組み合わせた新し … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, I.2.7 | コメントを受け付けていません

Minerva: A Programmable Memory Test Benchmark for Language Models

投稿日: 2025年6月10日作成者: jarxiv

要約 LLMベースのAIアシスタントは、メモリ（コンテキスト）をどの程度効果的に … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

WeQA: A Benchmark for Retrieval Augmented Generation in Wind Energy Domain

投稿日: 2025年6月10日作成者: jarxiv

要約 Wind Energy Project Assessmentは、意思決定者 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

ConECT Dataset: Overcoming Data Scarcity in Context-Aware E-Commerce MT

投稿日: 2025年6月10日作成者: jarxiv

要約ニューラルマシン翻訳（NMT）は、変圧器ベースのモデルを使用することで翻訳 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

WebUIBench: A Comprehensive Benchmark for Evaluating Multimodal Large Language Models in WebUI-to-Code

投稿日: 2025年6月10日作成者: jarxiv

要約生成AIテクノロジーの急速な進歩により、マルチモーダルラージランゲージモデ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Swiss Parliaments Corpus Re-Imagined (SPC_R): Enhanced Transcription with RAG-based Correction and Predicted BLEU

Augmenting LLMs’ Reasoning by Reinforcing Abstract Thinking

Is poisoning a real threat to LLM alignment? Maybe more so than you think

LLM Unlearning Should Be Form-Independent

Generalized Interpolating Discrete Diffusion

MultiMatch: Multihead Consistency Regularization Matching for Semi-Supervised Text Classification

Minerva: A Programmable Memory Test Benchmark for Language Models

WeQA: A Benchmark for Retrieval Augmented Generation in Wind Energy Domain

ConECT Dataset: Overcoming Data Scarcity in Context-Aware E-Commerce MT

WebUIBench: A Comprehensive Benchmark for Evaluating Multimodal Large Language Models in WebUI-to-Code

最近の投稿

最近のコメント

アーカイブ

カテゴリー