-
最近の投稿
- Multimodal Active Measurement for Human Mesh Recovery in Close Proximity
- An Algorithm for Distributed Computation of Reachable Sets for Multi-Agent Systems
- Meta-Learning Augmented MPC for Disturbance-Aware Motion Planning and Control of Quadrotors
- Solving Multi-Goal Robotic Tasks with Decision Transformer
- Context-Aware Command Understanding for Tabletop Scenarios
-
最近のコメント
表示できるコメントはありません。 cs.AI (27848) cs.CL (21045) cs.CR (2180) cs.CV (34554) cs.LG (32592) cs.RO (15968) cs.SY (2478) eess.IV (4238) eess.SY (2472) stat.ML (4364)
投稿者「jarxiv」のアーカイブ
On the Limited Generalization Capability of the Implicit Reward Model Induced by Direct Preference Optimization
要約 人間のフィードバックからの強化学習(RLHF)は、言語モデルを人間の嗜好に … 続きを読む
Enhanced Automated Code Vulnerability Repair using Large Language Models
要約 この研究は、テクノロジー主導の世界においてデジタル・セキュリティを強化する … 続きを読む
On the Proper Treatment of Tokenization in Psycholinguistics
要約 言語モデルは、計算心理言語学において、ある言語モデルにおける注目領域(文字 … 続きを読む
The Mystery of In-Context Learning: A Comprehensive Survey on Interpretation and Analysis
要約 大規模言語モデル(LLM)が実証例を通して習熟することを可能にする文脈内学 … 続きを読む
Turning English-centric LLMs Into Polyglots: How Much Multilinguality Is Needed?
要約 今日の大規模言語モデル(LLM)の大部分は英語中心であり、主に英語のテキス … 続きを読む
UncertaintyRAG: Span-Level Uncertainty Enhanced Long-Context Modeling for Retrieval-Augmented Generation
要約 我々は、テキストチャンク間の類似性を推定するために、信号対雑音比(SNR) … 続きを読む
Grounding Large Language Models In Embodied Environment With Imperfect World Models
要約 様々なアプリケーションで広く成功を収めているにもかかわらず、大規模言語モデ … 続きを読む
MA-RLHF: Reinforcement Learning from Human Feedback with Macro Actions
要約 人間のフィードバックからの強化学習(RLHF)は、大規模言語モデル(LLM … 続きを読む
On Training Data Influence of GPT Models
要約 生成言語モデルの急速な進歩の中で、学習データがGPTモデルの性能をどのよう … 続きを読む