月別アーカイブ: 2025年2月

Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking

投稿日: 2025年2月28日作成者: jarxiv

要約チェーンオブ思考（COT）は、幅広いタスクにわたって大規模な言語モデル（L … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Educator Attention: How computational tools can systematically identify the distribution of a key resource for students

投稿日: 2025年2月28日作成者: jarxiv

要約教育者の注意は学生の成功にとって重要ですが、教育者が学生に注意を分配する方 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Telephone Surveys Meet Conversational AI: Evaluating a LLM-Based Telephone Survey System at Scale

投稿日: 2025年2月28日作成者: jarxiv

要約電話調査は依然として洞察を収集するための貴重なツールですが、通常、人間のイ … 続きを読む →

カテゴリー: cs.CL, cs.HC | コメントを受け付けていません

LongAttn: Selecting Long-context Training Data via Token-level Attention

投稿日: 2025年2月28日作成者: jarxiv

要約大規模な言語モデル（LLMS）の開発により、長いコンテキストの処理において … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Similarity-Distance-Magnitude Universal Verification

投稿日: 2025年2月28日作成者: jarxiv

要約類似性（つまり、トレーニングに深さマッチを正しく予測する）を追加することに … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Re-evaluating Open-ended Evaluation of Large Language Models

投稿日: 2025年2月28日作成者: jarxiv

要約評価は、伝統的に特定のスキルの候補者のランキングに焦点を当ててきました。 … 続きを読む →

カテゴリー: cs.CL, cs.GT, cs.LG, stat.ML | コメントを受け付けていません

Continual Memorization of Factoids in Language Models

投稿日: 2025年2月28日作成者: jarxiv

要約新しい知識が急速に蓄積されるにつれて、前提条件の知識を持つ言語モデル（LM … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

The Impact of Unstated Norms in Bias Analysis of Language Models

投稿日: 2025年2月28日作成者: jarxiv

要約大規模な言語モデル（LLM）のバイアスには、明白な差別から暗黙のステレオタ … 続きを読む →

カテゴリー: 68T50, cs.CL, cs.CY, cs.LG | コメントを受け付けていません

An Extensive Evaluation of PDDL Capabilities in off-the-shelf LLMs

投稿日: 2025年2月28日作成者: jarxiv

要約最近の進歩において、大規模な言語モデル（LLMS）は、コード生成と考え方の … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Improving Neuron-level Interpretability with White-box Language Models

投稿日: 2025年2月28日作成者: jarxiv

要約 GPT-2のような自動再帰言語モデルのニューロンは、その活性化パターンを分 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

月別アーカイブ: 2025年2月

Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking

Educator Attention: How computational tools can systematically identify the distribution of a key resource for students

Telephone Surveys Meet Conversational AI: Evaluating a LLM-Based Telephone Survey System at Scale

LongAttn: Selecting Long-context Training Data via Token-level Attention

Similarity-Distance-Magnitude Universal Verification

Re-evaluating Open-ended Evaluation of Large Language Models

Continual Memorization of Factoids in Language Models

The Impact of Unstated Norms in Bias Analysis of Language Models

An Extensive Evaluation of PDDL Capabilities in off-the-shelf LLMs

Improving Neuron-level Interpretability with White-box Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー