投稿者「jarxiv」のアーカイブ

Optimized Multi-Token Joint Decoding with Auxiliary Model for LLM Inference

要約 大規模言語モデル (LLM) は、さまざまなタスクにわたって目覚ましい成功 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

An Exploration of Self-Supervised Mutual Information Alignment for Multi-Task Settings

要約 個々の属性や好みに合わせて言語モデルを導くことができる、多元的な調整手法の … 続きを読む

カテゴリー: cs.CL | コメントする

Interpretable Contrastive Monte Carlo Tree Search Reasoning

要約 私たちは SC-MCTS* を提案します。これは、大規模言語モデル (LL … 続きを読む

カテゴリー: cs.CL | コメントする

Examining the Role of Relationship Alignment in Large Language Models

要約 ソーシャル環境におけるジェネレーティブ AI の急速な開発と展開により、精 … 続きを読む

カテゴリー: cs.CL, cs.SI | コメントする

SysCaps: Language Interfaces for Simulation Surrogates of Complex Systems

要約 サロゲート モデルは、従来の数値手法ではシミュレーションするには高価すぎる … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SY, eess.SY | コメントする

Automated Knowledge Concept Annotation and Question Representation Learning for Knowledge Tracing

要約 ナレッジ トレーシング (KT) は、時間の経過に伴う生徒の学習の進歩をモ … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Visual Perception in Text Strings

要約 連続文字に埋め込まれた視覚的セマンティクスを理解することは、大規模言語モデ … 続きを読む

カテゴリー: cs.CL | コメントする

LASeR: Learning to Adaptively Select Reward Models with Multi-Armed Bandits

要約 報酬モデル (RM) は、LLM を人間の好みに合わせる上で重要な役割を果 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

SCAR: Efficient Instruction-Tuning for Large Language Models via Style Consistency-Aware Response Ranking

要約 最近の研究では、人間の専門家による一貫した応答スタイルを維持し、トレーニン … 続きを読む

カテゴリー: cs.CL | コメントする

Recursive Abstractive Processing for Retrieval in Dynamic Datasets

要約 最近の検索拡張モデルは、再帰的な埋め込み、クラスタリング、および要約を通じ … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする