月別アーカイブ: 2025年4月

LLMs Meet Finance: Fine-Tuning Foundation Models for the Open FinLLM Leaderboard

要約 このペーパーでは、大規模な言語モデル(LLM)の財務タスクへの適用を調査し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LLMs Meet Finance: Fine-Tuning Foundation Models for the Open FinLLM Leaderboard はコメントを受け付けていません

FreshStack: Building Realistic Benchmarks for Evaluating Retrieval on Technical Documents

要約 コミュニティの質問や回答から情報検索(IR)評価ベンチマークを自動的に構築 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | FreshStack: Building Realistic Benchmarks for Evaluating Retrieval on Technical Documents はコメントを受け付けていません

Syntactic and Semantic Control of Large Language Models via Sequential Monte Carlo

要約 幅広いLMアプリケーションでは、構文またはセマンティックの制約に準拠するテ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Syntactic and Semantic Control of Large Language Models via Sequential Monte Carlo はコメントを受け付けていません

A general language model for peptide identification

要約 ペプチド同定の進歩は、タンパク質機能を解読し、治療的発見を加速する当社の能 … 続きを読む

カテゴリー: 68T07, 92C40, cs.AI, cs.LG, I.2.6 | A general language model for peptide identification はコメントを受け付けていません

Exploring Expert Failures Improves LLM Agent Tuning

要約 大規模な言語モデル(LLM)は、エージェントとして大きな可能性を示しており … 続きを読む

カテゴリー: cs.AI | Exploring Expert Failures Improves LLM Agent Tuning はコメントを受け付けていません

Antidistillation Sampling

要約 拡張された推論トレースを生成するフロンティアモデルは、モデルの蒸留を促進で … 続きを読む

カテゴリー: cs.AI, cs.CL | Antidistillation Sampling はコメントを受け付けていません

MIB: A Mechanistic Interpretability Benchmark

要約 新しい機械的解釈可能性の方法が実際の改善を達成するかどうかをどのように知る … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | MIB: A Mechanistic Interpretability Benchmark はコメントを受け付けていません

RUKA: Rethinking the Design of Humanoid Hands with Learning

要約 器用な操作は、ロボットシステムの基本的な能力ですが、正確さ、コンパクト性、 … 続きを読む

カテゴリー: cs.AI, cs.RO | RUKA: Rethinking the Design of Humanoid Hands with Learning はコメントを受け付けていません

Sleep-time Compute: Beyond Inference Scaling at Test-time

要約 スケーリングテスト時間計算は、大規模な言語モデル(LLM)を可能にするため … 続きを読む

カテゴリー: cs.AI, cs.CL | Sleep-time Compute: Beyond Inference Scaling at Test-time はコメントを受け付けていません

It’s All Connected: A Journey Through Test-Time Memorization, Attentional Bias, Retention, and Online Optimization

要約 効率的かつ効果的な建築バックボーンの設計は、基礎モデルの能力を高めるための … 続きを読む

カテゴリー: cs.AI, cs.LG | It’s All Connected: A Journey Through Test-Time Memorization, Attentional Bias, Retention, and Online Optimization はコメントを受け付けていません