月別アーカイブ: 2024年6月

Benchmarking of LLM Detection: Comparing Two Competing Approaches

要約 この記事では、LLM テキスト認識の分野の概要を説明します。 LLM で生 … 続きを読む

カテゴリー: cs.AI, cs.CL | Benchmarking of LLM Detection: Comparing Two Competing Approaches はコメントを受け付けていません

BLoB: Bayesian Low-Rank Adaptation by Backpropagation for Large Language Models

要約 大規模言語モデル (LLM) は、特にデータが限られた下流のドメイン固有の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | BLoB: Bayesian Low-Rank Adaptation by Backpropagation for Large Language Models はコメントを受け付けていません

R-Eval: A Unified Toolkit for Evaluating Domain Knowledge of Retrieval Augmented Large Language Models

要約 大規模な言語モデルは、一般的な NLP タスクでは目覚ましい成功を収めてい … 続きを読む

カテゴリー: cs.AI, cs.CL | R-Eval: A Unified Toolkit for Evaluating Domain Knowledge of Retrieval Augmented Large Language Models はコメントを受け付けていません

Knowledge-to-Jailbreak: One Knowledge Point Worth One Attack

要約 大規模言語モデル (LLM) はさまざまなドメインにますます適用されており … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | Knowledge-to-Jailbreak: One Knowledge Point Worth One Attack はコメントを受け付けていません

The Role of Inherent Bellman Error in Offline Reinforcement Learning with Linear Function Approximation

要約 この論文では、一次関数近似を使用したオフライン RL 問題を研究します。 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | The Role of Inherent Bellman Error in Offline Reinforcement Learning with Linear Function Approximation はコメントを受け付けていません

t-DGR: A Trajectory-Based Deep Generative Replay Method for Continual Learning in Decision Making

要約 ディープジェネレーティブリプレイは、意思決定タスクにおける継続的な学習のた … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE | t-DGR: A Trajectory-Based Deep Generative Replay Method for Continual Learning in Decision Making はコメントを受け付けていません

Optimizing Instructions and Demonstrations for Multi-Stage Language Model Programs

要約 言語モデル プログラム、つまりモジュール言語モデル (LM) 呼び出しの洗 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Optimizing Instructions and Demonstrations for Multi-Stage Language Model Programs はコメントを受け付けていません

Generative Pretrained Structured Transformers: Unsupervised Syntactic Language Models at Scale

要約 構文言語モデル (SLM) は、左から右の方法で構文ツリーを含む文を増分的 … 続きを読む

カテゴリー: cs.AI, cs.CL | Generative Pretrained Structured Transformers: Unsupervised Syntactic Language Models at Scale はコメントを受け付けていません

Nemotron-4 340B Technical Report

要約 Nemotron-4-340B-Base、Nemotron-4-340B- … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Nemotron-4 340B Technical Report はコメントを受け付けていません

Refusal in Language Models Is Mediated by a Single Direction

要約 会話型の大規模言語モデルは、指示への従うことと安全性の両方を考慮して微調整 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Refusal in Language Models Is Mediated by a Single Direction はコメントを受け付けていません