月別アーカイブ: 2024年2月

Uncertainty of Thoughts: Uncertainty-Aware Planning Enhances Information Seeking in Large Language Models

投稿日: 2024年2月6日作成者: jarxiv

要約不確実性に直面したとき、情報を求める能力は基本的に重要である。医療診断やト … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Guiding Language Model Math Reasoning with Planning Tokens

投稿日: 2024年2月6日作成者: jarxiv

要約大規模言語モデル(LLM)は、思考連鎖推論のような複雑な推論タスクを実行す … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

A Framework for Partially Observed Reward-States in RLHF

投稿日: 2024年2月6日作成者: jarxiv

要約人間のフィードバックからの強化学習（RLHF）の研究は、LLMの開発におけ … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

Deal, or no deal (or who knows)? Forecasting Uncertainty in Conversations using Large Language Models

投稿日: 2024年2月6日作成者: jarxiv

要約効果的な対話者は、相手の不確かな目標、信念、感情を考慮する。しかし、どんな … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Make Every Move Count: LLM-based High-Quality RTL Code Generation Using MCTS

投稿日: 2024年2月6日作成者: jarxiv

要約レジスタ転送レベルのコード生成のための既存の大規模言語モデル（LLM）は、 … 続きを読む →

カテゴリー: cs.AI, cs.AR, cs.LG | コメントを受け付けていません

Distilled GPT for Source Code Summarization

投稿日: 2024年2月6日作成者: jarxiv

要約コード要約とは、ソースコードを自然言語で簡潔に記述したものです。要約は通常 … 続きを読む →

カテゴリー: cs.AI, cs.SE | コメントを受け付けていません

Flora: Low-Rank Adapters Are Secretly Gradient Compressors

投稿日: 2024年2月6日作成者: jarxiv

要約大規模なニューラルネットワークは、様々なタスクをこなす卓越した能力を示すに … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

Ginger: An Efficient Curvature Approximation with Linear Complexity for General Neural Networks

投稿日: 2024年2月6日作成者: jarxiv

要約一般化ガウス・ニュートン法のような2次最適化アプローチは、前提条件行列を用 … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC, stat.ML | コメントを受け付けていません

DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

投稿日: 2024年2月6日作成者: jarxiv

要約数学的推論は、その複雑で構造化された性質のため、言語モデルにとって大きな課 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Nevermind: Instruction Override and Moderation in Large Language Models

投稿日: 2024年2月6日作成者: jarxiv

要約最近の大規模言語モデル（Large Language Models: LL … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年2月

Uncertainty of Thoughts: Uncertainty-Aware Planning Enhances Information Seeking in Large Language Models

Guiding Language Model Math Reasoning with Planning Tokens

A Framework for Partially Observed Reward-States in RLHF

Deal, or no deal (or who knows)? Forecasting Uncertainty in Conversations using Large Language Models

Make Every Move Count: LLM-based High-Quality RTL Code Generation Using MCTS

Distilled GPT for Source Code Summarization

Flora: Low-Rank Adapters Are Secretly Gradient Compressors

Ginger: An Efficient Curvature Approximation with Linear Complexity for General Neural Networks

DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

Nevermind: Instruction Override and Moderation in Large Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー