月別アーカイブ: 2024年2月

Uncertainty of Thoughts: Uncertainty-Aware Planning Enhances Information Seeking in Large Language Models

要約 不確実性に直面したとき、情報を求める能力は基本的に重要である。医療診断やト … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Uncertainty of Thoughts: Uncertainty-Aware Planning Enhances Information Seeking in Large Language Models はコメントを受け付けていません

Guiding Language Model Math Reasoning with Planning Tokens

要約 大規模言語モデル(LLM)は、思考連鎖推論のような複雑な推論タスクを実行す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Guiding Language Model Math Reasoning with Planning Tokens はコメントを受け付けていません

A Framework for Partially Observed Reward-States in RLHF

要約 人間のフィードバックからの強化学習(RLHF)の研究は、LLMの開発におけ … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | A Framework for Partially Observed Reward-States in RLHF はコメントを受け付けていません

Deal, or no deal (or who knows)? Forecasting Uncertainty in Conversations using Large Language Models

要約 効果的な対話者は、相手の不確かな目標、信念、感情を考慮する。しかし、どんな … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Deal, or no deal (or who knows)? Forecasting Uncertainty in Conversations using Large Language Models はコメントを受け付けていません

Make Every Move Count: LLM-based High-Quality RTL Code Generation Using MCTS

要約 レジスタ転送レベルのコード生成のための既存の大規模言語モデル(LLM)は、 … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.LG | Make Every Move Count: LLM-based High-Quality RTL Code Generation Using MCTS はコメントを受け付けていません

Distilled GPT for Source Code Summarization

要約 コード要約とは、ソースコードを自然言語で簡潔に記述したものです。要約は通常 … 続きを読む

カテゴリー: cs.AI, cs.SE | Distilled GPT for Source Code Summarization はコメントを受け付けていません

Flora: Low-Rank Adapters Are Secretly Gradient Compressors

要約 大規模なニューラルネットワークは、様々なタスクをこなす卓越した能力を示すに … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Flora: Low-Rank Adapters Are Secretly Gradient Compressors はコメントを受け付けていません

Ginger: An Efficient Curvature Approximation with Linear Complexity for General Neural Networks

要約 一般化ガウス・ニュートン法のような2次最適化アプローチは、前提条件行列を用 … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC, stat.ML | Ginger: An Efficient Curvature Approximation with Linear Complexity for General Neural Networks はコメントを受け付けていません

DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

要約 数学的推論は、その複雑で構造化された性質のため、言語モデルにとって大きな課 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models はコメントを受け付けていません

Nevermind: Instruction Override and Moderation in Large Language Models

要約 最近の大規模言語モデル(Large Language Models: LL … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Nevermind: Instruction Override and Moderation in Large Language Models はコメントを受け付けていません