cs.LG」カテゴリーアーカイブ

Controlled Model Debiasing through Minimal and Interpretable Updates

要約 公正な機械学習モデルを学習するための従来のアプローチでは、一般的に既存の以 … 続きを読む

カテゴリー: cs.LG, stat.ML | コメントする

Cache Me If You Must: Adaptive Key-Value Quantization for Large Language Models

要約 大規模な言語モデル(LLMS)の効率的な実世界の展開は、長い出力を処理およ … 続きを読む

カテゴリー: cs.LG | コメントする

Enabling AutoML for Zero-Touch Network Security: Use-Case Driven Analysis

要約 ゼロタッチネットワーク(ZTNS)は、完全に自動化されたインテリジェントな … 続きを読む

カテゴリー: 68T01, 90C31, cs.CR, cs.LG, cs.NI, I.2.1 | コメントする

Nearly Optimal Algorithms for Contextual Dueling Bandits from Adversarial Feedback

要約 人間のフィードバックから学ぶことは、大規模な言語モデル(LLM)などの生成 … 続きを読む

カテゴリー: cs.LG | コメントする

Eliciting In-context Retrieval and Reasoning for Long-context Large Language Models

要約 ロングコンテキスト言語モデル(LCLMS)の最近の進歩は、パイプラインを簡 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | コメントする

ForecastBench: A Dynamic Benchmark of AI Forecasting Capabilities

要約 将来のイベントの予測は、情報に基づいた意思決定への重要な入力です。 機械学 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

DropBP: Accelerating Fine-Tuning of Large Language Models by Dropping Backward Propagation

要約 大規模な言語モデル(LLM)は、さまざまなドメインで大きな成功を収めていま … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Training-Free Exponential Context Extension via Cascading KV Cache

要約 トランスのコンテキストウィンドウは、アクティブメモリ用の前のトークンを保存 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Kanana: Compute-efficient Bilingual Language Models

要約 韓国語でのパフォーマンスを超え、英語での競争力のあるパフォーマンスを示す一 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Learning diverse attacks on large language models for robust red-teaming and safety tuning

要約 有害な応答を引き出すレッドチーム、または識別プロンプトは、大規模な言語モデ … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | コメントする