月別アーカイブ: 2025年2月

MILU: A Multi-task Indic Language Understanding Benchmark

要約 低リソースで言語的に多様な言語における大規模言語モデル(LLM)の評価は、 … 続きを読む

カテゴリー: cs.CL | コメントする

Is poisoning a real threat to LLM alignment? Maybe more so than you think

要約 人間のフィードバックを伴う強化学習(RLHF)の最近の進歩は、大規模言語モ … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | コメントする

SimPER: A Minimalist Approach to Preference Alignment without Hyperparameters

要約 言語モデルのアライメントのための既存のプリファレンス最適化目標では、最適な … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Beemo: Benchmark of Expert-edited Machine-generated Outputs

要約 大規模言語モデル(LLM)の急速な普及により、機械生成テキスト(MGT)の … 続きを読む

カテゴリー: cs.CL | コメントする

Beyond English: Evaluating Automated Measurement of Moral Foundations in Non-English Discourse with a Chinese Case Study

要約 本研究では、非英語コーパスにおける道徳的基盤(MF)を測定するための計算論 … 続きを読む

カテゴリー: cs.CL, cs.SI | コメントする

Rankify: A Comprehensive Python Toolkit for Retrieval, Re-Ranking, and Retrieval-Augmented Generation

要約 検索、再順位付け、および検索拡張生成(RAG)は、情報検索、質問応答、およ … 続きを読む

カテゴリー: cs.CL, cs.IR | コメントする

Multilingual Machine Translation with Open Large Language Models at Practical Scale: An Empirical Study

要約 大規模言語モデル(LLM)は継続的に多言語能力を向上させており、小規模なオ … 続きを読む

カテゴリー: cs.CL | コメントする

Analyzing Similarity Metrics for Data Selection for Language Model Pretraining

要約 学習例間の類似性は、言語モデルの事前学習データセットをキュレートするために … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Exploring Empty Spaces: Human-in-the-Loop Data Augmentation

要約 機械学習モデルをよりロバストで安全なものにするためには、データの増強が不可 … 続きを読む

カテゴリー: cs.CL, cs.HC, cs.LG | コメントする

Adaptive Self-improvement LLM Agentic System for ML Library Development

要約 MLライブラリは、多くの場合、ドメイン固有アーキテクチャをターゲットとする … 続きを読む

カテゴリー: cs.CL | コメントする