「cs.LG」カテゴリーアーカイブ

Optimal Quantization for Matrix Multiplication

投稿日: 2024年10月18日作成者: jarxiv

要約機械学習コミュニティの最近の研究では、大きな行列の非可逆圧縮 (量子化) … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IT, cs.LG, math.IT | コメントを受け付けていません

Learning Graph Quantized Tokenizers for Transformers

投稿日: 2024年10月18日作成者: jarxiv

要約トランスフォーマーは、基礎モデルのバックボーンアーキテクチャとして機能し … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.NE | コメントを受け付けていません

Data-Driven Estimation of Heterogeneous Treatment Effects

投稿日: 2024年10月18日作成者: jarxiv

要約治療がさまざまな個人にどのような影響を与えるかを推定することは、不均一な治 … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ME | コメントを受け付けていません

Many-Shot In-Context Learning

投稿日: 2024年10月18日作成者: jarxiv

要約大規模言語モデル (LLM) は、重みの更新を行わずに、推論時にコンテキス … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Artificial Kuramoto Oscillatory Neurons

投稿日: 2024年10月18日作成者: jarxiv

要約神経科学と AI の両方において、ニューロン間の「結合」が、ネットワークの … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

Retrieval Augmented Generation or Long-Context LLMs? A Comprehensive Study and Hybrid Approach

投稿日: 2024年10月18日作成者: jarxiv

要約検索拡張生成 (RAG) は、大規模言語モデル (LLM) が長すぎるコン … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement

投稿日: 2024年10月18日作成者: jarxiv

要約ヒューマンフィードバックからの強化学習 (RLHF) は、言語モデル ( … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

The Disparate Benefits of Deep Ensembles

投稿日: 2024年10月18日作成者: jarxiv

要約ディープニューラルネットワークのアンサンブルであるディープアンサンブ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization

投稿日: 2024年10月18日作成者: jarxiv

要約報酬形成は強化学習 (RL) の重要な要素であり、特に報酬がまばらであると … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

SimLayerKV: A Simple Framework for Layer-Level KV Cache Reduction

投稿日: 2024年10月18日作成者: jarxiv

要約大規模言語モデル (LLM) の最近の進歩により、長いコンテキストを処理で … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Optimal Quantization for Matrix Multiplication

Learning Graph Quantized Tokenizers for Transformers

Data-Driven Estimation of Heterogeneous Treatment Effects

Many-Shot In-Context Learning

Artificial Kuramoto Oscillatory Neurons

Retrieval Augmented Generation or Long-Context LLMs? A Comprehensive Study and Hybrid Approach

A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement

The Disparate Benefits of Deep Ensembles

ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization

SimLayerKV: A Simple Framework for Layer-Level KV Cache Reduction

最近の投稿

最近のコメント

アーカイブ

カテゴリー