投稿者「jarxiv」のアーカイブ

Distortion of AI Alignment: Does Preference Optimization Optimize for Preferences?

要約 トレーニング前の後、大規模な言語モデルは、ペアワイズ比較に基づいて人間の好 … 続きを読む

カテゴリー: cs.GT, cs.LG | Distortion of AI Alignment: Does Preference Optimization Optimize for Preferences? はコメントを受け付けていません

Model Immunization from a Condition Number Perspective

要約 モデル予防接種の目的は、他の非耐性タスクで有用性を維持しながら、有害なタス … 続きを読む

カテゴリー: cs.LG | Model Immunization from a Condition Number Perspective はコメントを受け付けていません

Fast Large Language Model Collaborative Decoding via Speculation

要約 大規模な言語モデル(LLM)コラボレーションデコード手法は、各世代のステッ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Fast Large Language Model Collaborative Decoding via Speculation はコメントを受け付けていません

Probability-Consistent Preference Optimization for Enhanced LLM Reasoning

要約 優先最適化の最近の進歩は、大規模な言語モデル(LLM)の数学的推論能力を改 … 続きを読む

カテゴリー: cs.CL | Probability-Consistent Preference Optimization for Enhanced LLM Reasoning はコメントを受け付けていません

Translation in the Wild

要約 大規模な言語モデル(LLM)は、とりわけ翻訳に優れており、ゼロおよび少数の … 続きを読む

カテゴリー: cs.CL | Translation in the Wild はコメントを受け付けていません

Enhancing Automated Interpretability with Output-Centric Feature Descriptions

要約 自動化された解釈可能性パイプラインは、植物や文の最初の単語など、大規模な言 … 続きを読む

カテゴリー: cs.CL | Enhancing Automated Interpretability with Output-Centric Feature Descriptions はコメントを受け付けていません

Understanding Refusal in Language Models with Sparse Autoencoders

要約 拒否は、整合した言語モデルの重要な安全行動ですが、拒否を促進する内部メカニ … 続きを読む

カテゴリー: cs.CL | Understanding Refusal in Language Models with Sparse Autoencoders はコメントを受け付けていません

LEXam: Benchmarking Legal Reasoning on 340 Law Exams

要約 テスト時間スケーリングの最近の進歩にもかかわらず、長い形式の法的推論は依然 … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, cs.LG, I.2 | LEXam: Benchmarking Legal Reasoning on 340 Law Exams はコメントを受け付けていません

Segment Policy Optimization: Effective Segment-Level Credit Assignment in RL for Large Language Models

要約 強化学習(RL)を使用して効果的に大規模な言語モデルの推論能力を強化するこ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Segment Policy Optimization: Effective Segment-Level Credit Assignment in RL for Large Language Models はコメントを受け付けていません

Evaluating AI capabilities in detecting conspiracy theories on YouTube

要約 膨大なグローバルな視聴者を持つ大手オンラインプラットフォームとして、You … 続きを読む

カテゴリー: cs.CL, cs.CY, cs.SI | Evaluating AI capabilities in detecting conspiracy theories on YouTube はコメントを受け付けていません