月別アーカイブ: 2024年5月

Croissant: A Metadata Format for ML-Ready Datasets

要約 データは機械学習 (ML) にとって重要なリソースですが、データの操作は依 … 続きを読む

カテゴリー: cs.AI, cs.DB, cs.IR, cs.LG | Croissant: A Metadata Format for ML-Ready Datasets はコメントを受け付けていません

Not All Experts are Equal: Efficient Expert Pruning and Skipping for Mixture-of-Experts Large Language Models

要約 大規模言語モデル (LLM) の進歩における極めて重要な進歩は、Mixtu … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Not All Experts are Equal: Efficient Expert Pruning and Skipping for Mixture-of-Experts Large Language Models はコメントを受け付けていません

The Empirical Impact of Neural Parameter Symmetries, or Lack Thereof

要約 深層学習における多くのアルゴリズムと観察された現象は、パラメーターの対称性 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | The Empirical Impact of Neural Parameter Symmetries, or Lack Thereof はコメントを受け付けていません

Grokfast: Accelerated Grokking by Amplifying Slow Gradients

要約 機械学習におけるグロッキングと呼ばれる不可解なアーティファクトの 1 つは … 続きを読む

カテゴリー: cs.AI, cs.LG | Grokfast: Accelerated Grokking by Amplifying Slow Gradients はコメントを受け付けていません

Context Injection Attacks on Large Language Models

要約 ChatGPT や Llama-2 などの大規模言語モデル (LLM) は … 続きを読む

カテゴリー: cs.AI | Context Injection Attacks on Large Language Models はコメントを受け付けていません

Training-efficient density quantum machine learning

要約 量子機械学習が困難な問題を解決するには、強力で柔軟で効率的にトレーニング可 … 続きを読む

カテゴリー: cs.AI, cs.LG, quant-ph | Training-efficient density quantum machine learning はコメントを受け付けていません

Retrieval Augmented Structured Generation: Business Document Information Extraction As Tool Use

要約 ビジネス文書情報抽出 (BDIE) は、非構造化情報の塊 (生のテキスト、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Retrieval Augmented Structured Generation: Business Document Information Extraction As Tool Use はコメントを受け付けていません

Formalizing and Benchmarking Prompt Injection Attacks and Defenses

要約 プロンプトインジェクション攻撃は、悪意のある命令/データを LLM 統合ア … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Formalizing and Benchmarking Prompt Injection Attacks and Defenses はコメントを受け付けていません

OLLIE: Imitation Learning from Offline Pretraining to Online Finetuning

要約 この論文では、静的なデモンストレーション データから模倣ポリシーを事前トレ … 続きを読む

カテゴリー: cs.AI, cs.LG | OLLIE: Imitation Learning from Offline Pretraining to Online Finetuning はコメントを受け付けていません

Absolute Policy Optimization

要約 近年、信頼領域のポリシー強化学習は、複雑な制御タスクやゲーム シナリオに対 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Absolute Policy Optimization はコメントを受け付けていません