cs.LG」カテゴリーアーカイブ

Enabling AutoML for Zero-Touch Network Security: Use-Case Driven Analysis

要約 ゼロタッチネットワーク(ZTNS)は、完全に自動化されたインテリジェントな … 続きを読む

カテゴリー: 68T01, 90C31, cs.CR, cs.LG, cs.NI, I.2.1 | Enabling AutoML for Zero-Touch Network Security: Use-Case Driven Analysis はコメントを受け付けていません

Nearly Optimal Algorithms for Contextual Dueling Bandits from Adversarial Feedback

要約 人間のフィードバックから学ぶことは、大規模な言語モデル(LLM)などの生成 … 続きを読む

カテゴリー: cs.LG | Nearly Optimal Algorithms for Contextual Dueling Bandits from Adversarial Feedback はコメントを受け付けていません

Eliciting In-context Retrieval and Reasoning for Long-context Large Language Models

要約 ロングコンテキスト言語モデル(LCLMS)の最近の進歩は、パイプラインを簡 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | Eliciting In-context Retrieval and Reasoning for Long-context Large Language Models はコメントを受け付けていません

ForecastBench: A Dynamic Benchmark of AI Forecasting Capabilities

要約 将来のイベントの予測は、情報に基づいた意思決定への重要な入力です。 機械学 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | ForecastBench: A Dynamic Benchmark of AI Forecasting Capabilities はコメントを受け付けていません

DropBP: Accelerating Fine-Tuning of Large Language Models by Dropping Backward Propagation

要約 大規模な言語モデル(LLM)は、さまざまなドメインで大きな成功を収めていま … 続きを読む

カテゴリー: cs.CL, cs.LG | DropBP: Accelerating Fine-Tuning of Large Language Models by Dropping Backward Propagation はコメントを受け付けていません

Training-Free Exponential Context Extension via Cascading KV Cache

要約 トランスのコンテキストウィンドウは、アクティブメモリ用の前のトークンを保存 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Training-Free Exponential Context Extension via Cascading KV Cache はコメントを受け付けていません

Kanana: Compute-efficient Bilingual Language Models

要約 韓国語でのパフォーマンスを超え、英語での競争力のあるパフォーマンスを示す一 … 続きを読む

カテゴリー: cs.CL, cs.LG | Kanana: Compute-efficient Bilingual Language Models はコメントを受け付けていません

Learning diverse attacks on large language models for robust red-teaming and safety tuning

要約 有害な応答を引き出すレッドチーム、または識別プロンプトは、大規模な言語モデ … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | Learning diverse attacks on large language models for robust red-teaming and safety tuning はコメントを受け付けていません

SPAM: Spike-Aware Adam with Momentum Reset for Stable LLM Training

要約 大規模な言語モデル(LLMS)は、多様なタスク全体で並外れたパフォーマンス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | SPAM: Spike-Aware Adam with Momentum Reset for Stable LLM Training はコメントを受け付けていません

CS-Bench: A Comprehensive Benchmark for Large Language Models towards Computer Science Mastery

要約 大規模な言語モデル(LLM)は、研究と社会のさまざまな分野を進める上で重要 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | CS-Bench: A Comprehensive Benchmark for Large Language Models towards Computer Science Mastery はコメントを受け付けていません