-
最近の投稿
- On the Feedback Law in Stochastic Optimal Nonlinear Control
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16023) cs.SY (2485) eess.IV (4238) eess.SY (2479) stat.ML (4372)
投稿者「jarxiv」のアーカイブ
Finding path and cycle counting formulae in graphs with Deep Reinforcement Learning
要約 この論文では、モンテカルロ木探索 (MCTS) を使用する強化学習アルゴリ … 続きを読む
Bridging Context Gaps: Leveraging Coreference Resolution for Long Contextual Understanding
要約 大規模言語モデル (LLM) は、自然言語処理において顕著な能力を示してい … 続きを読む
Trying to be human: Linguistic traces of stochastic empathy in language models
要約 生成されたコンテンツと人間が書いたコンテンツを区別することは、現代の世界を … 続きを読む
Mind Scramble: Unveiling Large Language Model Psychology Via Typoglycemia
要約 大規模言語モデル (LLM) の外部動作と内部メカニズムに関する研究は、物 … 続きを読む
Positional Attention: Out-of-Distribution Generalization and Expressivity for Neural Algorithmic Reasoning
要約 算術演算、要約統計量、並べ替えなどのアルゴリズム タスクを解決するニューラ … 続きを読む
Uncertainty Quantification with Bayesian Higher Order ReLU KANs
要約 我々は、コルモゴロフ・アーノルド・ネットワークの領域における不確実性定量化 … 続きを読む
カテゴリー: cs.AI, cs.LG, physics.data-an
コメントする
Almost Sure Convergence of Average Reward Temporal Difference Learning
要約 表形式の平均報酬時間差 (TD) 学習は、平均報酬強化学習においておそらく … 続きを読む
Tool-Planner: Task Planning with Clusters across Multiple Tools
要約 大規模言語モデル (LLM) は、優れた推論能力を実証しており、さまざまな … 続きを読む
Why context matters in VQA and Reasoning: Semantic interventions for VLM input modalities
要約 幻覚やモデルの失敗など、生成 AI にはさまざまな制限があるため、視覚言語 … 続きを読む
FactAlign: Long-form Factuality Alignment of Large Language Models
要約 大規模な言語モデルは、次世代の情報アクセス エンジンとして大きな可能性を示 … 続きを読む