月別アーカイブ: 2025年2月

Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking

要約 チェーンオブ思考(COT)は、幅広いタスクにわたって大規模な言語モデル(L … 続きを読む

カテゴリー: cs.CL, cs.LG | Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking はコメントを受け付けていません

Educator Attention: How computational tools can systematically identify the distribution of a key resource for students

要約 教育者の注意は学生の成功にとって重要ですが、教育者が学生に注意を分配する方 … 続きを読む

カテゴリー: cs.CL | Educator Attention: How computational tools can systematically identify the distribution of a key resource for students はコメントを受け付けていません

Telephone Surveys Meet Conversational AI: Evaluating a LLM-Based Telephone Survey System at Scale

要約 電話調査は依然として洞察を収集するための貴重なツールですが、通常、人間のイ … 続きを読む

カテゴリー: cs.CL, cs.HC | Telephone Surveys Meet Conversational AI: Evaluating a LLM-Based Telephone Survey System at Scale はコメントを受け付けていません

LongAttn: Selecting Long-context Training Data via Token-level Attention

要約 大規模な言語モデル(LLMS)の開発により、長いコンテキストの処理において … 続きを読む

カテゴリー: cs.CL | LongAttn: Selecting Long-context Training Data via Token-level Attention はコメントを受け付けていません

Similarity-Distance-Magnitude Universal Verification

要約 類似性(つまり、トレーニングに深さマッチを正しく予測する)を追加することに … 続きを読む

カテゴリー: cs.CL, cs.LG | Similarity-Distance-Magnitude Universal Verification はコメントを受け付けていません

Re-evaluating Open-ended Evaluation of Large Language Models

要約 評価は、伝統的に特定のスキルの候補者のランキングに焦点を当ててきました。 … 続きを読む

カテゴリー: cs.CL, cs.GT, cs.LG, stat.ML | Re-evaluating Open-ended Evaluation of Large Language Models はコメントを受け付けていません

Continual Memorization of Factoids in Language Models

要約 新しい知識が急速に蓄積されるにつれて、前提条件の知識を持つ言語モデル(LM … 続きを読む

カテゴリー: cs.CL | Continual Memorization of Factoids in Language Models はコメントを受け付けていません

The Impact of Unstated Norms in Bias Analysis of Language Models

要約 大規模な言語モデル(LLM)のバイアスには、明白な差別から暗黙のステレオタ … 続きを読む

カテゴリー: 68T50, cs.CL, cs.CY, cs.LG | The Impact of Unstated Norms in Bias Analysis of Language Models はコメントを受け付けていません

An Extensive Evaluation of PDDL Capabilities in off-the-shelf LLMs

要約 最近の進歩において、大規模な言語モデル(LLMS)は、コード生成と考え方の … 続きを読む

カテゴリー: cs.AI, cs.CL | An Extensive Evaluation of PDDL Capabilities in off-the-shelf LLMs はコメントを受け付けていません

Improving Neuron-level Interpretability with White-box Language Models

要約 GPT-2のような自動再帰言語モデルのニューロンは、その活性化パターンを分 … 続きを読む

カテゴリー: cs.CL, cs.LG | Improving Neuron-level Interpretability with White-box Language Models はコメントを受け付けていません