「cs.LG」カテゴリーアーカイブ

Enabling AutoML for Zero-Touch Network Security: Use-Case Driven Analysis

投稿日: 2025年3月3日作成者: jarxiv

要約ゼロタッチネットワーク（ZTNS）は、完全に自動化されたインテリジェントな … 続きを読む →

カテゴリー: 68T01, 90C31, cs.CR, cs.LG, cs.NI, I.2.1 | コメントを受け付けていません

Nearly Optimal Algorithms for Contextual Dueling Bandits from Adversarial Feedback

投稿日: 2025年3月3日作成者: jarxiv

要約人間のフィードバックから学ぶことは、大規模な言語モデル（LLM）などの生成 … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Eliciting In-context Retrieval and Reasoning for Long-context Large Language Models

投稿日: 2025年3月3日作成者: jarxiv

要約ロングコンテキスト言語モデル（LCLMS）の最近の進歩は、パイプラインを簡 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | コメントを受け付けていません

ForecastBench: A Dynamic Benchmark of AI Forecasting Capabilities

投稿日: 2025年3月3日作成者: jarxiv

要約将来のイベントの予測は、情報に基づいた意思決定への重要な入力です。機械学 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

DropBP: Accelerating Fine-Tuning of Large Language Models by Dropping Backward Propagation

投稿日: 2025年3月3日作成者: jarxiv

要約大規模な言語モデル（LLM）は、さまざまなドメインで大きな成功を収めていま … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Training-Free Exponential Context Extension via Cascading KV Cache

投稿日: 2025年3月3日作成者: jarxiv

要約トランスのコンテキストウィンドウは、アクティブメモリ用の前のトークンを保存 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Kanana: Compute-efficient Bilingual Language Models

投稿日: 2025年3月3日作成者: jarxiv

要約韓国語でのパフォーマンスを超え、英語での競争力のあるパフォーマンスを示す一 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Learning diverse attacks on large language models for robust red-teaming and safety tuning

投稿日: 2025年3月3日作成者: jarxiv

要約有害な応答を引き出すレッドチーム、または識別プロンプトは、大規模な言語モデ … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.LG | コメントを受け付けていません

SPAM: Spike-Aware Adam with Momentum Reset for Stable LLM Training

投稿日: 2025年3月3日作成者: jarxiv

要約大規模な言語モデル（LLMS）は、多様なタスク全体で並外れたパフォーマンス … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

CS-Bench: A Comprehensive Benchmark for Large Language Models towards Computer Science Mastery

投稿日: 2025年3月3日作成者: jarxiv

要約大規模な言語モデル（LLM）は、研究と社会のさまざまな分野を進める上で重要 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Enabling AutoML for Zero-Touch Network Security: Use-Case Driven Analysis

Nearly Optimal Algorithms for Contextual Dueling Bandits from Adversarial Feedback

Eliciting In-context Retrieval and Reasoning for Long-context Large Language Models

ForecastBench: A Dynamic Benchmark of AI Forecasting Capabilities

DropBP: Accelerating Fine-Tuning of Large Language Models by Dropping Backward Propagation

Training-Free Exponential Context Extension via Cascading KV Cache

Kanana: Compute-efficient Bilingual Language Models

Learning diverse attacks on large language models for robust red-teaming and safety tuning

SPAM: Spike-Aware Adam with Momentum Reset for Stable LLM Training

CS-Bench: A Comprehensive Benchmark for Large Language Models towards Computer Science Mastery

最近の投稿

最近のコメント

アーカイブ

カテゴリー