-
最近の投稿
- Simplified POMDP Planning with an Alternative Observation Space and Formal Performance Guarantees
- FREA: Feasibility-Guided Generation of Safety-Critical Scenarios with Reasonable Adversariality
- Enhanced Robot Planning and Perception through Environment Prediction
- FlowRetrieval: Flow-Guided Data Retrieval for Few-Shot Imitation Learning
- Energy-Cautious Designation of Kinematic Parameters for a Sustainable Parallel-Serial Heavy-Duty Manipulator Driven by Electromechanical Linear Actuator
-
最近のコメント
表示できるコメントはありません。 cs.AI (27989) cs.CL (21147) cs.CR (2187) cs.CV (34671) cs.LG (32719) cs.RO (16074) cs.SY (2489) eess.IV (4240) eess.SY (2483) stat.ML (4382)
投稿者「jarxiv」のアーカイブ
Optimized Multi-Token Joint Decoding with Auxiliary Model for LLM Inference
要約 大規模言語モデル (LLM) は、さまざまなタスクにわたって目覚ましい成功 … 続きを読む
An Exploration of Self-Supervised Mutual Information Alignment for Multi-Task Settings
要約 個々の属性や好みに合わせて言語モデルを導くことができる、多元的な調整手法の … 続きを読む
Interpretable Contrastive Monte Carlo Tree Search Reasoning
要約 私たちは SC-MCTS* を提案します。これは、大規模言語モデル (LL … 続きを読む
Examining the Role of Relationship Alignment in Large Language Models
要約 ソーシャル環境におけるジェネレーティブ AI の急速な開発と展開により、精 … 続きを読む
SysCaps: Language Interfaces for Simulation Surrogates of Complex Systems
要約 サロゲート モデルは、従来の数値手法ではシミュレーションするには高価すぎる … 続きを読む
Automated Knowledge Concept Annotation and Question Representation Learning for Knowledge Tracing
要約 ナレッジ トレーシング (KT) は、時間の経過に伴う生徒の学習の進歩をモ … 続きを読む
Visual Perception in Text Strings
要約 連続文字に埋め込まれた視覚的セマンティクスを理解することは、大規模言語モデ … 続きを読む
LASeR: Learning to Adaptively Select Reward Models with Multi-Armed Bandits
要約 報酬モデル (RM) は、LLM を人間の好みに合わせる上で重要な役割を果 … 続きを読む
SCAR: Efficient Instruction-Tuning for Large Language Models via Style Consistency-Aware Response Ranking
要約 最近の研究では、人間の専門家による一貫した応答スタイルを維持し、トレーニン … 続きを読む
Recursive Abstractive Processing for Retrieval in Dynamic Datasets
要約 最近の検索拡張モデルは、再帰的な埋め込み、クラスタリング、および要約を通じ … 続きを読む