投稿者「jarxiv」のアーカイブ

Computational, Data-Driven, and Physics-Informed Machine Learning Approaches for Microstructure Modeling in Metal Additive Manufacturing

要約 金属積層造形は、これまでにない設計の自由度と、カスタマイズされた複雑なコン … 続きを読む

カテゴリー: cs.LG | Computational, Data-Driven, and Physics-Informed Machine Learning Approaches for Microstructure Modeling in Metal Additive Manufacturing はコメントを受け付けていません

A Mathematical Philosophy of Explanations in Mechanistic Interpretability — The Strange Science Part I.i

要約 力学的解釈可能性は、因果的説明を通してニューラルネットワークを理解すること … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | A Mathematical Philosophy of Explanations in Mechanistic Interpretability — The Strange Science Part I.i はコメントを受け付けていません

Knowledge-augmented Pre-trained Language Models for Biomedical Relation Extraction

要約 生物医学文献からの自動関係抽出(RE)は、毎年生み出される膨大な量の科学知 … 続きを読む

カテゴリー: cs.CL | Knowledge-augmented Pre-trained Language Models for Biomedical Relation Extraction はコメントを受け付けていません

SmallPlan: Leverage Small Language Models for Sequential Path Planning with Simulation-Powered, LLM-Guided Distillation

要約 ロボット工学、特に大規模で動的な環境における効率的な経路計画は、依然として … 続きを読む

カテゴリー: cs.CL, cs.RO | SmallPlan: Leverage Small Language Models for Sequential Path Planning with Simulation-Powered, LLM-Guided Distillation はコメントを受け付けていません

CITER: Collaborative Inference for Efficient Large Language Model Decoding with Token-Level Routing

要約 大規模言語モデルは、様々なタスクにおいて目覚ましい成功を収めているが、推論 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PF | CITER: Collaborative Inference for Efficient Large Language Model Decoding with Token-Level Routing はコメントを受け付けていません

Activation Steering in Neural Theorem Provers

要約 大規模言語モデル(LLM)は、Leanのような証明アシスタントを用いた形式 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Activation Steering in Neural Theorem Provers はコメントを受け付けていません

NeMo-Inspector: A Visualization Tool for LLM Generation Analysis

要約 大規模言語モデル(LLM)を新しいタスクに適応させ、その全体的な能力を向上 … 続きを読む

カテゴリー: cs.CL, cs.LG | NeMo-Inspector: A Visualization Tool for LLM Generation Analysis はコメントを受け付けていません

Accuracy is Not Agreement: Expert-Aligned Evaluation of Crash Narrative Classification Models

要約 本研究では、ディープラーニング(DL)モデルの精度と、クラッシュナラティブ … 続きを読む

カテゴリー: cs.AI, cs.CL | Accuracy is Not Agreement: Expert-Aligned Evaluation of Crash Narrative Classification Models はコメントを受け付けていません

How Transformers Learn Regular Language Recognition: A Theoretical Study on Training Dynamics and Implicit Bias

要約 言語認識タスクは自然言語処理(NLP)の基本であり、大規模言語モデル(LL … 続きを読む

カテゴリー: cs.CL, cs.LG, stat.ML | How Transformers Learn Regular Language Recognition: A Theoretical Study on Training Dynamics and Implicit Bias はコメントを受け付けていません

AutoPrep: Natural Language Question-Aware Data Preparation with a Multi-Agent Framework

要約 表形式質問応答(TQA)として知られる、表に関する自然言語(NL)の質問に … 続きを読む

カテゴリー: cs.AI, cs.CL | AutoPrep: Natural Language Question-Aware Data Preparation with a Multi-Agent Framework はコメントを受け付けていません