月別アーカイブ: 2025年5月

Principled Out-of-Distribution Generalization via Simplicity

要約 現代の基礎モデルは、顕著な分散排出(OOD)一般化を示し、トレーニングデー … 続きを読む

カテゴリー: cs.LG, math.ST, stat.ML, stat.TH | Principled Out-of-Distribution Generalization via Simplicity はコメントを受け付けていません

GraphOmni: A Comprehensive and Extendable Benchmark Framework for Large Language Models on Graph-theoretic Tasks

要約 このペーパーでは、自然言語で明確に表現されたグラフ理論タスク上のLLMの推 … 続きを読む

カテゴリー: cs.DM, cs.LG | GraphOmni: A Comprehensive and Extendable Benchmark Framework for Large Language Models on Graph-theoretic Tasks はコメントを受け付けていません

Understanding (Un)Reliability of Steering Vectors in Language Models

要約 ステアリングベクターは、推論時間に活性化に学習バイアスを追加することにより … 続きを読む

カテゴリー: cs.LG | Understanding (Un)Reliability of Steering Vectors in Language Models はコメントを受け付けていません

SimProcess: High Fidelity Simulation of Noisy ICS Physical Processes

要約 産業制御システム(ICS)は、電力網や水処理プラントなどの重要なインフラス … 続きを読む

カテゴリー: cs.CR, cs.LG | SimProcess: High Fidelity Simulation of Noisy ICS Physical Processes はコメントを受け付けていません

Spectral Survival Analysis

要約 サバイバル分析は、ヘルスケア、ビジネス、エコロジーなどを含む多様な分野に広 … 続きを読む

カテゴリー: cs.LG | Spectral Survival Analysis はコメントを受け付けていません

On Learning Verifiers for Chain-of-Thought Reasoning

要約 考え方の推論は、複雑な数学的および論理的な問題を解決するための強力なアプロ … 続きを読む

カテゴリー: cs.LG | On Learning Verifiers for Chain-of-Thought Reasoning はコメントを受け付けていません

AstroVisBench: A Code Benchmark for Scientific Computing and Visualization in Astronomy

要約 大規模な言語モデル(LLM)は、文献を統合し、研究の質問に答え、研究のアイ … 続きを読む

カテゴリー: astro-ph.IM, cs.CL, cs.LG | AstroVisBench: A Code Benchmark for Scientific Computing and Visualization in Astronomy はコメントを受け付けていません

RAG-Zeval: Towards Robust and Interpretable Evaluation on RAG Responses through End-to-End Rule-Guided Reasoning

要約 堅牢な評価は、信頼できる検索の高等世代(RAG)システムを展開するために重 … 続きを読む

カテゴリー: cs.CL | RAG-Zeval: Towards Robust and Interpretable Evaluation on RAG Responses through End-to-End Rule-Guided Reasoning はコメントを受け付けていません

Gender-Neutral Large Language Models for Medical Applications: Reducing Bias in PubMed Abstracts

要約 このペーパーでは、性別の職業代名詞を中和することにより医学文献で使用される … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | Gender-Neutral Large Language Models for Medical Applications: Reducing Bias in PubMed Abstracts はコメントを受け付けていません

Unsupervised Post-Training for Multi-Modal LLM Reasoning via GRPO

要約 トレーニング後の段階でのマルチモーダル大手言語モデル(MLLMS)の改善は … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Unsupervised Post-Training for Multi-Modal LLM Reasoning via GRPO はコメントを受け付けていません