月別アーカイブ: 2025年5月

SWE-smith: Scaling Data for Software Engineering Agents

要約 ソフトウェアエンジニアリングの言語モデル(LMS)の最近の進歩にもかかわら … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE | SWE-smith: Scaling Data for Software Engineering Agents はコメントを受け付けていません

Soft Thinking: Unlocking the Reasoning Potential of LLMs in Continuous Concept Space

要約 人間の認知は、通常、個別の言語トークンを厳密に使用するのではなく、抽象的で … 続きを読む

カテゴリー: cs.AI, cs.CL | Soft Thinking: Unlocking the Reasoning Potential of LLMs in Continuous Concept Space はコメントを受け付けていません

Large Language Models as Computable Approximations to Solomonoff Induction

要約 大規模な言語モデル(LLMS)の急速な進歩は、経験的な成功を説明するために … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Large Language Models as Computable Approximations to Solomonoff Induction はコメントを受け付けていません

A Modular Approach for Clinical SLMs Driven by Synthetic Data with Pre-Instruction Tuning, Model Merging, and Clinical-Tasks Alignment

要約 GPT-4などの大規模な言語モデルの高い計算コストと遅延により、臨床環境で … 続きを読む

カテゴリー: cs.AI, cs.CL | A Modular Approach for Clinical SLMs Driven by Synthetic Data with Pre-Instruction Tuning, Model Merging, and Clinical-Tasks Alignment はコメントを受け付けていません

Spatiotemporal Field Generation Based on Hybrid Mamba-Transformer with Physics-informed Fine-tuning

要約 この研究は、データ駆動型の訓練されたモデルを通じて時空間的物理フィールドの … 続きを読む

カテゴリー: cs.AI, cs.LG, physics.comp-ph | Spatiotemporal Field Generation Based on Hybrid Mamba-Transformer with Physics-informed Fine-tuning はコメントを受け付けていません

Resource Heterogeneity-Aware and Utilization-Enhanced Scheduling for Deep Learning Clusters

要約 GPUやTPUなどのアクセラレータを備えた強力なクラスターをトレーニングす … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG, I.2.11 | Resource Heterogeneity-Aware and Utilization-Enhanced Scheduling for Deep Learning Clusters はコメントを受け付けていません

Exploring the Innovation Opportunities for Pre-trained Models

要約 イノベーターは、サービスが顧客のニーズを正常に満たしている場所を理解し、こ … 続きを読む

カテゴリー: cs.AI, cs.HC | Exploring the Innovation Opportunities for Pre-trained Models はコメントを受け付けていません

Long-Form Information Alignment Evaluation Beyond Atomic Facts

要約 情報の調整評価者は、さまざまなNLG評価タスクと信頼できるLLMの展開に不 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Long-Form Information Alignment Evaluation Beyond Atomic Facts はコメントを受け付けていません

BARE: Leveraging Base Language Models for Few-Shot Synthetic Data Generation

要約 モデルトレーニングにおける高品質のデータの需要が高まるにつれて、研究者と開 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | BARE: Leveraging Base Language Models for Few-Shot Synthetic Data Generation はコメントを受け付けていません

Effectively Controlling Reasoning Models through Thinking Intervention

要約 推論強化された大手言語モデル(LLMS)は、最終回答を生成する前に中間推論 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Effectively Controlling Reasoning Models through Thinking Intervention はコメントを受け付けていません