月別アーカイブ: 2025年3月

SpikeLLM: Scaling up Spiking Neural Network to Large Language Models via Saliency-based Spiking

要約 近年、数十億ものパラメータを持つ大規模言語モデル(LLM)が進歩し、様々な … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.NE | SpikeLLM: Scaling up Spiking Neural Network to Large Language Models via Saliency-based Spiking はコメントを受け付けていません

Learning Efficient Recursive Numeral Systems via Reinforcement Learning

要約 強化学習(RL)を用いることで、エージェントが人間のものに似た単純な近似的 … 続きを読む

カテゴリー: cs.CL | Learning Efficient Recursive Numeral Systems via Reinforcement Learning はコメントを受け付けていません

Subtle Errors Matter: Preference Learning via Error-injected Self-editing

要約 ラージ・ランゲージ・モデル(LLM)は、基本的な算数から高度な競技レベルの … 続きを読む

カテゴリー: cs.AI, cs.CL | Subtle Errors Matter: Preference Learning via Error-injected Self-editing はコメントを受け付けていません

Learning to Align Multi-Faceted Evaluation: A Unified and Robust Framework

要約 大規模言語モデル(LLM)は、様々なシナリオにおける自動評価のために、ます … 続きを読む

カテゴリー: cs.AI, cs.CL | Learning to Align Multi-Faceted Evaluation: A Unified and Robust Framework はコメントを受け付けていません

Test-Time Compute: from System-1 Thinking to System-2 Thinking

要約 複雑な推論におけるo1モデルの顕著な性能は、テスト時間の計算スケーリングが … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Test-Time Compute: from System-1 Thinking to System-2 Thinking はコメントを受け付けていません

DailyDilemmas: Revealing Value Preferences of LLMs with Quandaries of Daily Life

要約 日常生活における意思決定において、ユーザーがLLMのガイダンスを求めること … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | DailyDilemmas: Revealing Value Preferences of LLMs with Quandaries of Daily Life はコメントを受け付けていません

Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation

要約 音声品質評価では通常、平均オピニオンスコア(MOS)や話者類似度(SIM) … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation はコメントを受け付けていません

Selected Languages are All You Need for Cross-lingual Truthfulness Transfer

要約 大規模言語モデル(Large Language Models: LLMs) … 続きを読む

カテゴリー: cs.CL | Selected Languages are All You Need for Cross-lingual Truthfulness Transfer はコメントを受け付けていません

Dynamics of Instruction Fine-Tuning for Chinese Large Language Models

要約 インストラクションチューニングは、大規模言語モデル(LLM)の一般的な知能 … 続きを読む

カテゴリー: cs.CL | Dynamics of Instruction Fine-Tuning for Chinese Large Language Models はコメントを受け付けていません

Robust Preference Optimization through Reward Model Distillation

要約 言語モデル(LM)のポストトレーニング(またはアライメント)には、嗜好アノ … 続きを読む

カテゴリー: cs.CL, cs.LG | Robust Preference Optimization through Reward Model Distillation はコメントを受け付けていません