月別アーカイブ: 2024年6月

Benchmarking of LLM Detection: Comparing Two Competing Approaches

投稿日: 2024年6月18日作成者: jarxiv

要約この記事では、LLM テキスト認識の分野の概要を説明します。 LLM で生 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

BLoB: Bayesian Low-Rank Adaptation by Backpropagation for Large Language Models

投稿日: 2024年6月18日作成者: jarxiv

要約大規模言語モデル (LLM) は、特にデータが限られた下流のドメイン固有の … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | コメントを受け付けていません

R-Eval: A Unified Toolkit for Evaluating Domain Knowledge of Retrieval Augmented Large Language Models

投稿日: 2024年6月18日作成者: jarxiv

要約大規模な言語モデルは、一般的な NLP タスクでは目覚ましい成功を収めてい … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Knowledge-to-Jailbreak: One Knowledge Point Worth One Attack

投稿日: 2024年6月18日作成者: jarxiv

要約大規模言語モデル (LLM) はさまざまなドメインにますます適用されており … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR | コメントを受け付けていません

The Role of Inherent Bellman Error in Offline Reinforcement Learning with Linear Function Approximation

投稿日: 2024年6月18日作成者: jarxiv

要約この論文では、一次関数近似を使用したオフライン RL 問題を研究します。 … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

t-DGR: A Trajectory-Based Deep Generative Replay Method for Continual Learning in Decision Making

投稿日: 2024年6月18日作成者: jarxiv

要約ディープジェネレーティブリプレイは、意思決定タスクにおける継続的な学習のた … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.NE | コメントを受け付けていません

Optimizing Instructions and Demonstrations for Multi-Stage Language Model Programs

投稿日: 2024年6月18日作成者: jarxiv

要約言語モデルプログラム、つまりモジュール言語モデル (LM) 呼び出しの洗 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Generative Pretrained Structured Transformers: Unsupervised Syntactic Language Models at Scale

投稿日: 2024年6月18日作成者: jarxiv

要約構文言語モデル (SLM) は、左から右の方法で構文ツリーを含む文を増分的 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Nemotron-4 340B Technical Report

投稿日: 2024年6月18日作成者: jarxiv

要約 Nemotron-4-340B-Base、Nemotron-4-340B- … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Refusal in Language Models Is Mediated by a Single Direction

投稿日: 2024年6月18日作成者: jarxiv

要約会話型の大規模言語モデルは、指示への従うことと安全性の両方を考慮して微調整 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年6月

Benchmarking of LLM Detection: Comparing Two Competing Approaches

BLoB: Bayesian Low-Rank Adaptation by Backpropagation for Large Language Models

R-Eval: A Unified Toolkit for Evaluating Domain Knowledge of Retrieval Augmented Large Language Models

Knowledge-to-Jailbreak: One Knowledge Point Worth One Attack

The Role of Inherent Bellman Error in Offline Reinforcement Learning with Linear Function Approximation

t-DGR: A Trajectory-Based Deep Generative Replay Method for Continual Learning in Decision Making

Optimizing Instructions and Demonstrations for Multi-Stage Language Model Programs

Generative Pretrained Structured Transformers: Unsupervised Syntactic Language Models at Scale

Nemotron-4 340B Technical Report

Refusal in Language Models Is Mediated by a Single Direction

最近の投稿

最近のコメント

アーカイブ

カテゴリー