月別アーカイブ: 2024年6月

LACIE: Listener-Aware Finetuning for Confidence Calibration in Large Language Models

投稿日: 2024年6月3日作成者: jarxiv

要約質問に答えるとき、LLM は答えだけでなく、その答えが正しいという自信のレ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Standards for Belief Representations in LLMs

投稿日: 2024年6月3日作成者: jarxiv

要約大規模言語モデル (LLM) がさまざまな領域にわたって顕著な能力を示し続 … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

Direct Alignment of Language Models via Quality-Aware Self-Refinement

投稿日: 2024年6月3日作成者: jarxiv

要約人間のフィードバックからの強化学習 (RLHF) は、大規模言語モデル ( … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

API Pack: A Massive Multi-Programming Language Dataset for API Call Generation

投稿日: 2024年6月3日作成者: jarxiv

要約大規模な言語モデルの API 呼び出し生成機能を向上させるために、100 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Target Networks and Over-parameterization Stabilize Off-policy Bootstrapping with Function Approximation

投稿日: 2024年6月3日作成者: jarxiv

要約ターゲットネットワークと過剰パラメータ化された線形関数近似の組み合わせに … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Exploratory Preference Optimization: Harnessing Implicit Q*-Approximation for Sample-Efficient RLHF

投稿日: 2024年6月3日作成者: jarxiv

要約ヒューマンフィードバックからの強化学習 (RLHF) は、言語モデルの調 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | コメントを受け付けていません

Grammar-Aligned Decoding

投稿日: 2024年6月3日作成者: jarxiv

要約大規模言語モデル (LLM) は、プログラムコード、数式、整形式のマーク … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Generalization or Memorization: Data Contamination and Trustworthy Evaluation for Large Language Models

投稿日: 2024年6月3日作成者: jarxiv

要約大規模言語モデル (LLM) の優れた機能に関する最近の声明は、通常、オー … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG, cs.SE | コメントを受け付けていません

Neural Network Verification with Branch-and-Bound for General Nonlinearities

投稿日: 2024年6月3日作成者: jarxiv

要約分枝限定 (BaB) は、ニューラルネットワーク (NN) 検証に最も効 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Recurrent neural networks: vanishing and exploding gradients are not the end of the story

投稿日: 2024年6月3日作成者: jarxiv

要約リカレントニューラルネットワーク (RNN) は、主に勾配の消失と爆発 … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC | コメントを受け付けていません

月別アーカイブ: 2024年6月

LACIE: Listener-Aware Finetuning for Confidence Calibration in Large Language Models

Standards for Belief Representations in LLMs

Direct Alignment of Language Models via Quality-Aware Self-Refinement

API Pack: A Massive Multi-Programming Language Dataset for API Call Generation

Target Networks and Over-parameterization Stabilize Off-policy Bootstrapping with Function Approximation

Exploratory Preference Optimization: Harnessing Implicit Q*-Approximation for Sample-Efficient RLHF

Grammar-Aligned Decoding

Generalization or Memorization: Data Contamination and Trustworthy Evaluation for Large Language Models

Neural Network Verification with Branch-and-Bound for General Nonlinearities

Recurrent neural networks: vanishing and exploding gradients are not the end of the story

最近の投稿

最近のコメント

アーカイブ

カテゴリー