月別アーカイブ: 2025年5月

SWE-smith: Scaling Data for Software Engineering Agents

投稿日: 2025年5月22日作成者: jarxiv

要約ソフトウェアエンジニアリングの言語モデル（LMS）の最近の進歩にもかかわら … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SE | コメントを受け付けていません

Soft Thinking: Unlocking the Reasoning Potential of LLMs in Continuous Concept Space

投稿日: 2025年5月22日作成者: jarxiv

要約人間の認知は、通常、個別の言語トークンを厳密に使用するのではなく、抽象的で … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Large Language Models as Computable Approximations to Solomonoff Induction

投稿日: 2025年5月22日作成者: jarxiv

要約大規模な言語モデル（LLMS）の急速な進歩は、経験的な成功を説明するために … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

A Modular Approach for Clinical SLMs Driven by Synthetic Data with Pre-Instruction Tuning, Model Merging, and Clinical-Tasks Alignment

投稿日: 2025年5月22日作成者: jarxiv

要約 GPT-4などの大規模な言語モデルの高い計算コストと遅延により、臨床環境で … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Spatiotemporal Field Generation Based on Hybrid Mamba-Transformer with Physics-informed Fine-tuning

投稿日: 2025年5月22日作成者: jarxiv

要約この研究は、データ駆動型の訓練されたモデルを通じて時空間的物理フィールドの … 続きを読む →

カテゴリー: cs.AI, cs.LG, physics.comp-ph | コメントを受け付けていません

Resource Heterogeneity-Aware and Utilization-Enhanced Scheduling for Deep Learning Clusters

投稿日: 2025年5月22日作成者: jarxiv

要約 GPUやTPUなどのアクセラレータを備えた強力なクラスターをトレーニングす … 続きを読む →

カテゴリー: cs.AI, cs.DC, cs.LG, I.2.11 | コメントを受け付けていません

Exploring the Innovation Opportunities for Pre-trained Models

投稿日: 2025年5月22日作成者: jarxiv

要約イノベーターは、サービスが顧客のニーズを正常に満たしている場所を理解し、こ … 続きを読む →

カテゴリー: cs.AI, cs.HC | コメントを受け付けていません

Long-Form Information Alignment Evaluation Beyond Atomic Facts

投稿日: 2025年5月22日作成者: jarxiv

要約情報の調整評価者は、さまざまなNLG評価タスクと信頼できるLLMの展開に不 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

BARE: Leveraging Base Language Models for Few-Shot Synthetic Data Generation

投稿日: 2025年5月22日作成者: jarxiv

要約モデルトレーニングにおける高品質のデータの需要が高まるにつれて、研究者と開 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Effectively Controlling Reasoning Models through Thinking Intervention

投稿日: 2025年5月22日作成者: jarxiv

要約推論強化された大手言語モデル（LLMS）は、最終回答を生成する前に中間推論 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

月別アーカイブ: 2025年5月

SWE-smith: Scaling Data for Software Engineering Agents

Soft Thinking: Unlocking the Reasoning Potential of LLMs in Continuous Concept Space

Large Language Models as Computable Approximations to Solomonoff Induction

A Modular Approach for Clinical SLMs Driven by Synthetic Data with Pre-Instruction Tuning, Model Merging, and Clinical-Tasks Alignment

Spatiotemporal Field Generation Based on Hybrid Mamba-Transformer with Physics-informed Fine-tuning

Resource Heterogeneity-Aware and Utilization-Enhanced Scheduling for Deep Learning Clusters

Exploring the Innovation Opportunities for Pre-trained Models

Long-Form Information Alignment Evaluation Beyond Atomic Facts

BARE: Leveraging Base Language Models for Few-Shot Synthetic Data Generation

Effectively Controlling Reasoning Models through Thinking Intervention

最近の投稿

最近のコメント

アーカイブ

カテゴリー