月別アーカイブ: 2025年4月

Investigating and Scaling up Code-Switching for Multilingual Language Model Pre-Training

要約 大規模な言語モデル(LLMS)は、トレーニング前のデータに極端な言語の不均 … 続きを読む

カテゴリー: cs.CL | Investigating and Scaling up Code-Switching for Multilingual Language Model Pre-Training はコメントを受け付けていません

Efficient Constant-Space Multi-Vector Retrieval

要約 コルバートアーキテクチャによって例示された多面検索方法は、検索の潜在性と有 … 続きを読む

カテゴリー: cs.CL, cs.IR | Efficient Constant-Space Multi-Vector Retrieval はコメントを受け付けていません

LARGE: Legal Retrieval Augmented Generation Evaluation Tool

要約 最近、大規模な言語モデル(LLMS)の能力を高めるための検索上位生成(RA … 続きを読む

カテゴリー: cs.CL | LARGE: Legal Retrieval Augmented Generation Evaluation Tool はコメントを受け付けていません

Finding Transformer Circuits with Edge Pruning

要約 言語モデルの解釈への道は、多くの場合、回路の分析を介して進行します。これは … 続きを読む

カテゴリー: cs.CL | Finding Transformer Circuits with Edge Pruning はコメントを受け付けていません

Multilingual European Language Models: Benchmarking Approaches and Challenges

要約 チャットの相互作用を通じてさまざまなタスクを解決できる生成大型言語モデル( … 続きを読む

カテゴリー: cs.CL | Multilingual European Language Models: Benchmarking Approaches and Challenges はコメントを受け付けていません

DEPT: Decoupled Embeddings for Pre-training Language Models

要約 言語モデルのプリトレーニングでは、幅広いデータ混合物を使用して、ドメインと … 続きを読む

カテゴリー: cs.CL, cs.LG | DEPT: Decoupled Embeddings for Pre-training Language Models はコメントを受け付けていません

Code Generation and Algorithmic Problem Solving Using Llama 3.1 405B

要約 MetaのLlama 3.1 405bなどのLlama 3.1モデルによる … 続きを読む

カテゴリー: cs.CL, cs.SE | Code Generation and Algorithmic Problem Solving Using Llama 3.1 405B はコメントを受け付けていません

Is the Reversal Curse a Binding Problem? Uncovering Limitations of Transformers from a Basic Generalization Failure

要約 それらの印象的な能力にもかかわらず、LLMは逆転呪いとして知られる基本的な … 続きを読む

カテゴリー: cs.CL, cs.LG | Is the Reversal Curse a Binding Problem? Uncovering Limitations of Transformers from a Basic Generalization Failure はコメントを受け付けていません

Review, Refine, Repeat: Understanding Iterative Decoding of AI Agents with Dynamic Evaluation and Selection

要約 AIエージェントはさまざまなタスクで顕著なパフォーマンスを示していますが、 … 続きを読む

カテゴリー: cs.CL | Review, Refine, Repeat: Understanding Iterative Decoding of AI Agents with Dynamic Evaluation and Selection はコメントを受け付けていません

OpenCodeReasoning: Advancing Data Distillation for Competitive Coding

要約 推論に基づいた大規模な言語モデルの出現以来、多くの人は、推論能力を学生モデ … 続きを読む

カテゴリー: cs.CL | OpenCodeReasoning: Advancing Data Distillation for Competitive Coding はコメントを受け付けていません