「cs.LG」カテゴリーアーカイブ

Bayesian Experimental Design via Contrastive Diffusions

投稿日: 2024年10月16日作成者: jarxiv

要約ベイズ最適実験計画 (BOED) は、一連の実験の実行コストを削減する強力 … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

Agent Planning with World Knowledge Model

投稿日: 2024年10月16日作成者: jarxiv

要約インタラクティブな計画タスクを実行するためのエージェントモデルとして大規 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MA | コメントを受け付けていません

Discovering Knowledge-Critical Subnetworks in Pretrained Language Models

投稿日: 2024年10月16日作成者: jarxiv

要約事前トレーニングされた言語モデル (LM) は、パラメータ内の知識の暗黙的 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Inducing anxiety in large language models can induce bias

投稿日: 2024年10月16日作成者: jarxiv

要約大規模言語モデル (LLM) は、公開討論を活性化しながら、機械学習の研究 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

LLM-Mixer: Multiscale Mixing in LLMs for Time Series Forecasting

投稿日: 2024年10月16日作成者: jarxiv

要約時系列予測は、特に複雑なマルチスケールの時間パターンのコンテキストにおいて … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Phantom: General Trigger Attacks on Retrieval Augmented Language Generation

投稿日: 2024年10月16日作成者: jarxiv

要約検索拡張生成 (RAG) は、最も関連性の高い知識ソースへの応答を固定、適 … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.LG | コメントを受け付けていません

Mitigate Position Bias in Large Language Models via Scaling a Single Dimension

投稿日: 2024年10月16日作成者: jarxiv

要約大規模言語モデル (LLM) は、その優れた一般化機能と堅牢な生成機能によ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Layer-wise Importance Matters: Less Memory for Better Performance in Parameter-efficient Fine-tuning of Large Language Models

投稿日: 2024年10月16日作成者: jarxiv

要約パラメータ効率の良い微調整 (PEFT) 手法は、主にメモリと計算オーバー … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Self-Data Distillation for Recovering Quality in Pruned Large Language Models

投稿日: 2024年10月16日作成者: jarxiv

要約大規模な言語モデルにより、自然言語処理は大幅に進歩しましたが、その展開には … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

The $μ\mathcal{G}$ Language for Programming Graph Neural Networks

投稿日: 2024年10月16日作成者: jarxiv

要約グラフニューラルネットワークは、グラフ構造のデータを処理するように特別 … 続きを読む →

カテゴリー: cs.AI, cs.FL, cs.LG, D.2.4 | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Bayesian Experimental Design via Contrastive Diffusions

Agent Planning with World Knowledge Model

Discovering Knowledge-Critical Subnetworks in Pretrained Language Models

Inducing anxiety in large language models can induce bias

LLM-Mixer: Multiscale Mixing in LLMs for Time Series Forecasting

Phantom: General Trigger Attacks on Retrieval Augmented Language Generation

Mitigate Position Bias in Large Language Models via Scaling a Single Dimension

Layer-wise Importance Matters: Less Memory for Better Performance in Parameter-efficient Fine-tuning of Large Language Models

Self-Data Distillation for Recovering Quality in Pruned Large Language Models

The $μ\mathcal{G}$ Language for Programming Graph Neural Networks

最近の投稿

最近のコメント

アーカイブ

カテゴリー