投稿者「jarxiv」のアーカイブ

Harnessing Multiple Large Language Models: A Survey on LLM Ensemble

要約 LLM Ensembleは、それぞれが個々の強みから利益を得るために、それ … 続きを読む

カテゴリー: cs.CL | Harnessing Multiple Large Language Models: A Survey on LLM Ensemble はコメントを受け付けていません

Parallel Scaling Law for Language Models

要約 パラメーター(パラメータースケーリング)または出力トークン(推論時間スケー … 続きを読む

カテゴリー: cs.CL, cs.LG | Parallel Scaling Law for Language Models はコメントを受け付けていません

SceneGenAgent: Precise Industrial Scene Generation with Coding Agent

要約 産業シーンのモデリングは、産業製造のシミュレーションに不可欠です。 大規模 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SE | SceneGenAgent: Precise Industrial Scene Generation with Coding Agent はコメントを受け付けていません

CL-RAG: Bridging the Gap in Retrieval-Augmented Generation with Curriculum Learning

要約 検索された生成(RAG)は、大規模な言語モデル(LLM)の機能を強化する効 … 続きを読む

カテゴリー: cs.CL | CL-RAG: Bridging the Gap in Retrieval-Augmented Generation with Curriculum Learning はコメントを受け付けていません

Can You Really Trust Code Copilots? Evaluating Large Language Models from a Code Security Perspective

要約 コードセキュリティとユーザビリティは、大規模な言語モデル(LLM)によって … 続きを読む

カテゴリー: cs.CL | Can You Really Trust Code Copilots? Evaluating Large Language Models from a Code Security Perspective はコメントを受け付けていません

RouteNator: A Router-Based Multi-Modal Architecture for Generating Synthetic Training Data for Function Calling LLMs

要約 このペーパーでは、実際のユーザーインタラクションデータが利用できない場合、 … 続きを読む

カテゴリー: cs.CL, cs.LG | RouteNator: A Router-Based Multi-Modal Architecture for Generating Synthetic Training Data for Function Calling LLMs はコメントを受け付けていません

Disentangling Memory and Reasoning Ability in Large Language Models

要約 大規模な言語モデル(LLMS)は、広範な知識と推論能力の両方を必要とする複 … 続きを読む

カテゴリー: cs.CL | Disentangling Memory and Reasoning Ability in Large Language Models はコメントを受け付けていません

The Devil Is in the Word Alignment Details: On Translation-Based Cross-Lingual Transfer for Token Classification Tasks

要約 翻訳トレインなど、翻訳を横断する転送XLTのための翻訳ベースの戦略 &#8 … 続きを読む

カテゴリー: cs.CL | The Devil Is in the Word Alignment Details: On Translation-Based Cross-Lingual Transfer for Token Classification Tasks はコメントを受け付けていません

WorldPM: Scaling Human Preference Modeling

要約 モデルとデータセットのサイズを備えたパワー法則としてのテスト損失スケールを … 続きを読む

カテゴリー: cs.CL | WorldPM: Scaling Human Preference Modeling はコメントを受け付けていません

Beyond ‘Aha!’: Toward Systematic Meta-Abilities Alignment in Large Reasoning Models

要約 大規模な推論モデル(LRMS)は、既に長い考え方の推論のために潜在能力を持 … 続きを読む

カテゴリー: cs.CL | Beyond ‘Aha!’: Toward Systematic Meta-Abilities Alignment in Large Reasoning Models はコメントを受け付けていません