cs.AI」カテゴリーアーカイブ

Closing the Loop: Learning to Generate Writing Feedback via Language Model Simulated Student Revisions

要約 フィードバックを提供することは、生徒のライティング スキルを向上させるため … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Closing the Loop: Learning to Generate Writing Feedback via Language Model Simulated Student Revisions はコメントを受け付けていません

Optimal Transportation by Orthogonal Coupling Dynamics

要約 多くの数値アルゴリズムと学習タスクは、Monge-Kantorovich … 続きを読む

カテゴリー: cs.AI, math.OC | Optimal Transportation by Orthogonal Coupling Dynamics はコメントを受け付けていません

Reward-Augmented Data Enhances Direct Preference Alignment of LLMs

要約 大規模言語モデル (LLM) における好みの調整により、人間の指示や意図に … 続きを読む

カテゴリー: cs.AI, cs.LG | Reward-Augmented Data Enhances Direct Preference Alignment of LLMs はコメントを受け付けていません

Teaching-Inspired Integrated Prompting Framework: A Novel Approach for Enhancing Reasoning in Large Language Models

要約 大規模言語モデル (LLM) は、さまざまなドメインにわたって優れたパフォ … 続きを読む

カテゴリー: cs.AI, cs.CL | Teaching-Inspired Integrated Prompting Framework: A Novel Approach for Enhancing Reasoning in Large Language Models はコメントを受け付けていません

Sparse Attention Decomposition Applied to Circuit Tracing

要約 多くの論文は、アテンションヘッドが互いに連携して複雑なタスクを実行すること … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Sparse Attention Decomposition Applied to Circuit Tracing はコメントを受け付けていません

miniCodeProps: a Minimal Benchmark for Proving Code Properties

要約 AI エージェントは、Lean などの証明アシスタントでの数学定理証明の自 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SE | miniCodeProps: a Minimal Benchmark for Proving Code Properties はコメントを受け付けていません

Multimodal Optimization with k-Cluster Big Bang-Big Crunch Algorithm and Postprocessing Methods for Identification and Quantification of Optima

要約 マルチモーダル最適化は、エンジニアリング上の問題、特に異なる代替ソリューシ … 続きを読む

カテゴリー: cs.AI, cs.NE | Multimodal Optimization with k-Cluster Big Bang-Big Crunch Algorithm and Postprocessing Methods for Identification and Quantification of Optima はコメントを受け付けていません

Paramanu: A Family of Novel Efficient Generative Foundation Language Models for Indian Languages

要約 インド言語の新しい言語モデル (LM) ファミリーである「Paramanu … 続きを読む

カテゴリー: cs.AI, cs.CL | Paramanu: A Family of Novel Efficient Generative Foundation Language Models for Indian Languages はコメントを受け付けていません

Packing Analysis: Packing Is More Appropriate for Large Models or Datasets in Supervised Fine-tuning

要約 パッキングは、最初は事前トレーニング段階で利用され、モデルの最大入力長に合 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Packing Analysis: Packing Is More Appropriate for Large Models or Datasets in Supervised Fine-tuning はコメントを受け付けていません

Can Knowledge Graphs Make Large Language Models More Trustworthy? An Empirical Study over Open-ended Question Answering

要約 ナレッジ グラフ (KG) を統合する最近の研究により、大規模言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CL | Can Knowledge Graphs Make Large Language Models More Trustworthy? An Empirical Study over Open-ended Question Answering はコメントを受け付けていません