投稿者「jarxiv」のアーカイブ

LARGE: Legal Retrieval Augmented Generation Evaluation Tool

要約 最近、大規模な言語モデル(LLMS)の能力を高めるための検索上位生成(RA … 続きを読む

カテゴリー: cs.CL | LARGE: Legal Retrieval Augmented Generation Evaluation Tool はコメントを受け付けていません

Finding Transformer Circuits with Edge Pruning

要約 言語モデルの解釈への道は、多くの場合、回路の分析を介して進行します。これは … 続きを読む

カテゴリー: cs.CL | Finding Transformer Circuits with Edge Pruning はコメントを受け付けていません

Multilingual European Language Models: Benchmarking Approaches and Challenges

要約 チャットの相互作用を通じてさまざまなタスクを解決できる生成大型言語モデル( … 続きを読む

カテゴリー: cs.CL | Multilingual European Language Models: Benchmarking Approaches and Challenges はコメントを受け付けていません

DEPT: Decoupled Embeddings for Pre-training Language Models

要約 言語モデルのプリトレーニングでは、幅広いデータ混合物を使用して、ドメインと … 続きを読む

カテゴリー: cs.CL, cs.LG | DEPT: Decoupled Embeddings for Pre-training Language Models はコメントを受け付けていません

Code Generation and Algorithmic Problem Solving Using Llama 3.1 405B

要約 MetaのLlama 3.1 405bなどのLlama 3.1モデルによる … 続きを読む

カテゴリー: cs.CL, cs.SE | Code Generation and Algorithmic Problem Solving Using Llama 3.1 405B はコメントを受け付けていません

Is the Reversal Curse a Binding Problem? Uncovering Limitations of Transformers from a Basic Generalization Failure

要約 それらの印象的な能力にもかかわらず、LLMは逆転呪いとして知られる基本的な … 続きを読む

カテゴリー: cs.CL, cs.LG | Is the Reversal Curse a Binding Problem? Uncovering Limitations of Transformers from a Basic Generalization Failure はコメントを受け付けていません

Review, Refine, Repeat: Understanding Iterative Decoding of AI Agents with Dynamic Evaluation and Selection

要約 AIエージェントはさまざまなタスクで顕著なパフォーマンスを示していますが、 … 続きを読む

カテゴリー: cs.CL | Review, Refine, Repeat: Understanding Iterative Decoding of AI Agents with Dynamic Evaluation and Selection はコメントを受け付けていません

OpenCodeReasoning: Advancing Data Distillation for Competitive Coding

要約 推論に基づいた大規模な言語モデルの出現以来、多くの人は、推論能力を学生モデ … 続きを読む

カテゴリー: cs.CL | OpenCodeReasoning: Advancing Data Distillation for Competitive Coding はコメントを受け付けていません

Interpretable Steering of Large Language Models with Feature Guided Activation Additions

要約 大規模な言語モデル(LLM)の動作に対する効果的かつ信頼できる制御は、重要 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Interpretable Steering of Large Language Models with Feature Guided Activation Additions はコメントを受け付けていません

Epistemic Skills: Reasoning about Knowledge and Oblivion

要約 このペーパーでは、グループ知識の概念を取り入れながら、知識を獲得し、忘却に … 続きを読む

カテゴリー: cs.AI, cs.CC, cs.LO | Epistemic Skills: Reasoning about Knowledge and Oblivion はコメントを受け付けていません