-
最近の投稿
- On the Feedback Law in Stochastic Optimal Nonlinear Control
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16023) cs.SY (2485) eess.IV (4238) eess.SY (2479) stat.ML (4372)
投稿者「jarxiv」のアーカイブ
Optimized Multi-Token Joint Decoding with Auxiliary Model for LLM Inference
要約 大規模言語モデル (LLM) は、さまざまなタスクにわたって目覚ましい成功 … 続きを読む
An Exploration of Self-Supervised Mutual Information Alignment for Multi-Task Settings
要約 個々の属性や好みに合わせて言語モデルを導くことができる、多元的な調整手法の … 続きを読む
Interpretable Contrastive Monte Carlo Tree Search Reasoning
要約 私たちは SC-MCTS* を提案します。これは、大規模言語モデル (LL … 続きを読む
Examining the Role of Relationship Alignment in Large Language Models
要約 ソーシャル環境におけるジェネレーティブ AI の急速な開発と展開により、精 … 続きを読む
SysCaps: Language Interfaces for Simulation Surrogates of Complex Systems
要約 サロゲート モデルは、従来の数値手法ではシミュレーションするには高価すぎる … 続きを読む
Automated Knowledge Concept Annotation and Question Representation Learning for Knowledge Tracing
要約 ナレッジ トレーシング (KT) は、時間の経過に伴う生徒の学習の進歩をモ … 続きを読む
Visual Perception in Text Strings
要約 連続文字に埋め込まれた視覚的セマンティクスを理解することは、大規模言語モデ … 続きを読む
LASeR: Learning to Adaptively Select Reward Models with Multi-Armed Bandits
要約 報酬モデル (RM) は、LLM を人間の好みに合わせる上で重要な役割を果 … 続きを読む
SCAR: Efficient Instruction-Tuning for Large Language Models via Style Consistency-Aware Response Ranking
要約 最近の研究では、人間の専門家による一貫した応答スタイルを維持し、トレーニン … 続きを読む
Recursive Abstractive Processing for Retrieval in Dynamic Datasets
要約 最近の検索拡張モデルは、再帰的な埋め込み、クラスタリング、および要約を通じ … 続きを読む