投稿者「jarxiv」のアーカイブ

Harnessing Multiple Large Language Models: A Survey on LLM Ensemble

投稿日: 2025年5月16日作成者: jarxiv

要約 LLM Ensembleは、それぞれが個々の強みから利益を得るために、それ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Parallel Scaling Law for Language Models

投稿日: 2025年5月16日作成者: jarxiv

要約パラメーター（パラメータースケーリング）または出力トークン（推論時間スケー … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

SceneGenAgent: Precise Industrial Scene Generation with Coding Agent

投稿日: 2025年5月16日作成者: jarxiv

要約産業シーンのモデリングは、産業製造のシミュレーションに不可欠です。大規模 … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SE | コメントを受け付けていません

CL-RAG: Bridging the Gap in Retrieval-Augmented Generation with Curriculum Learning

投稿日: 2025年5月16日作成者: jarxiv

要約検索された生成（RAG）は、大規模な言語モデル（LLM）の機能を強化する効 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Can You Really Trust Code Copilots? Evaluating Large Language Models from a Code Security Perspective

投稿日: 2025年5月16日作成者: jarxiv

要約コードセキュリティとユーザビリティは、大規模な言語モデル（LLM）によって … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

RouteNator: A Router-Based Multi-Modal Architecture for Generating Synthetic Training Data for Function Calling LLMs

投稿日: 2025年5月16日作成者: jarxiv

要約このペーパーでは、実際のユーザーインタラクションデータが利用できない場合、 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Disentangling Memory and Reasoning Ability in Large Language Models

投稿日: 2025年5月16日作成者: jarxiv

要約大規模な言語モデル（LLMS）は、広範な知識と推論能力の両方を必要とする複 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

The Devil Is in the Word Alignment Details: On Translation-Based Cross-Lingual Transfer for Token Classification Tasks

投稿日: 2025年5月16日作成者: jarxiv

要約翻訳トレインなど、翻訳を横断する転送XLTのための翻訳ベースの戦略 &#8 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

WorldPM: Scaling Human Preference Modeling

投稿日: 2025年5月16日作成者: jarxiv

要約モデルとデータセットのサイズを備えたパワー法則としてのテスト損失スケールを … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Beyond ‘Aha!’: Toward Systematic Meta-Abilities Alignment in Large Reasoning Models

投稿日: 2025年5月16日作成者: jarxiv

要約大規模な推論モデル（LRMS）は、既に長い考え方の推論のために潜在能力を持 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Harnessing Multiple Large Language Models: A Survey on LLM Ensemble

Parallel Scaling Law for Language Models

SceneGenAgent: Precise Industrial Scene Generation with Coding Agent

CL-RAG: Bridging the Gap in Retrieval-Augmented Generation with Curriculum Learning

Can You Really Trust Code Copilots? Evaluating Large Language Models from a Code Security Perspective

RouteNator: A Router-Based Multi-Modal Architecture for Generating Synthetic Training Data for Function Calling LLMs

Disentangling Memory and Reasoning Ability in Large Language Models

The Devil Is in the Word Alignment Details: On Translation-Based Cross-Lingual Transfer for Token Classification Tasks

WorldPM: Scaling Human Preference Modeling

Beyond ‘Aha!’: Toward Systematic Meta-Abilities Alignment in Large Reasoning Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー