月別アーカイブ: 2025年2月

STAIR: Improving Safety Alignment with Introspective Reasoning

要約 大規模言語モデル(LLM)の安全性と無害性を保証することは、アプリケーショ … 続きを読む

カテゴリー: cs.CL | STAIR: Improving Safety Alignment with Introspective Reasoning はコメントを受け付けていません

Avoiding spurious sharpness minimization broadens applicability of SAM

要約 Sharpness Aware Minimization (SAM)のよう … 続きを読む

カテゴリー: cs.CL, cs.LG, stat.ML | Avoiding spurious sharpness minimization broadens applicability of SAM はコメントを受け付けていません

Plan*RAG: Efficient Test-Time Planning for Retrieval Augmented Generation

要約 本論文では、Plan*RAGを紹介する。Plan*RAGは、テスト時間の推 … 続きを読む

カテゴリー: cs.CL, cs.LG | Plan*RAG: Efficient Test-Time Planning for Retrieval Augmented Generation はコメントを受け付けていません

MILU: A Multi-task Indic Language Understanding Benchmark

要約 低リソースで言語的に多様な言語における大規模言語モデル(LLM)の評価は、 … 続きを読む

カテゴリー: cs.CL | MILU: A Multi-task Indic Language Understanding Benchmark はコメントを受け付けていません

Is poisoning a real threat to LLM alignment? Maybe more so than you think

要約 人間のフィードバックを伴う強化学習(RLHF)の最近の進歩は、大規模言語モ … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | Is poisoning a real threat to LLM alignment? Maybe more so than you think はコメントを受け付けていません

SimPER: A Minimalist Approach to Preference Alignment without Hyperparameters

要約 言語モデルのアライメントのための既存のプリファレンス最適化目標では、最適な … 続きを読む

カテゴリー: cs.CL, cs.LG | SimPER: A Minimalist Approach to Preference Alignment without Hyperparameters はコメントを受け付けていません

Beemo: Benchmark of Expert-edited Machine-generated Outputs

要約 大規模言語モデル(LLM)の急速な普及により、機械生成テキスト(MGT)の … 続きを読む

カテゴリー: cs.CL | Beemo: Benchmark of Expert-edited Machine-generated Outputs はコメントを受け付けていません

Beyond English: Evaluating Automated Measurement of Moral Foundations in Non-English Discourse with a Chinese Case Study

要約 本研究では、非英語コーパスにおける道徳的基盤(MF)を測定するための計算論 … 続きを読む

カテゴリー: cs.CL, cs.SI | Beyond English: Evaluating Automated Measurement of Moral Foundations in Non-English Discourse with a Chinese Case Study はコメントを受け付けていません

Rankify: A Comprehensive Python Toolkit for Retrieval, Re-Ranking, and Retrieval-Augmented Generation

要約 検索、再順位付け、および検索拡張生成(RAG)は、情報検索、質問応答、およ … 続きを読む

カテゴリー: cs.CL, cs.IR | Rankify: A Comprehensive Python Toolkit for Retrieval, Re-Ranking, and Retrieval-Augmented Generation はコメントを受け付けていません

Multilingual Machine Translation with Open Large Language Models at Practical Scale: An Empirical Study

要約 大規模言語モデル(LLM)は継続的に多言語能力を向上させており、小規模なオ … 続きを読む

カテゴリー: cs.CL | Multilingual Machine Translation with Open Large Language Models at Practical Scale: An Empirical Study はコメントを受け付けていません