月別アーカイブ: 2025年2月

Evalita-LLM: Benchmarking Large Language Models on Italian

要約 大規模言語モデル(LLM)をイタリア語のタスクで評価するために設計された新 … 続きを読む

カテゴリー: cs.CL | コメントする

VaiBot: Shuttle Between the Instructions and Parameters

要約 LLMとどのようにインタラクションするかは、研究者によって広く研究されてい … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

LightTransfer: Your Long-Context LLM is Secretly a Hybrid Model with Effortless Adaptation

要約 より長いコンテキストを処理するために言語モデルを拡張すると、キー・バリュー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

ReSpark: Leveraging Previous Data Reports as References to Generate New Reports with LLMs

要約 データレポートの作成は、データの探索と理解を繰り返し、その後に洞察を要約す … 続きを読む

カテゴリー: cs.CL, cs.HC | コメントする

AlphaSharpe: LLM-Driven Discovery of Robust Risk-Adjusted Metrics

要約 シャープレシオのような財務指標は、リスクとリターンのバランスを取ることによ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.NE, q-fin.PM, q-fin.RM | コメントする

Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking

要約 マルチモーダル大規模言語モデル(MLLM)は印象的な能力を示すが、複雑な視 … 続きを読む

カテゴリー: cs.CL | コメントする

Premise-Augmented Reasoning Chains Improve Error Identification in Math reasoning with LLMs

要約 Chain-of-Thought(CoT)プロンプトは、詳細なステップバイ … 続きを読む

カテゴリー: cs.CL | コメントする

STAIR: Improving Safety Alignment with Introspective Reasoning

要約 大規模言語モデル(LLM)の安全性と無害性を保証することは、アプリケーショ … 続きを読む

カテゴリー: cs.CL | コメントする

Avoiding spurious sharpness minimization broadens applicability of SAM

要約 Sharpness Aware Minimization (SAM)のよう … 続きを読む

カテゴリー: cs.CL, cs.LG, stat.ML | コメントする

Plan*RAG: Efficient Test-Time Planning for Retrieval Augmented Generation

要約 本論文では、Plan*RAGを紹介する。Plan*RAGは、テスト時間の推 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする