-
最近の投稿
- Open Challenges in the Formal Verification of Autonomous Driving
- Maximum Solar Energy Tracking Leverage High-DoF Robotics System with Deep Reinforcement Learning
- EdgeFlowNet: 100FPS@1W Dense Optical Flow For Tiny Mobile Robots
- A Systematic Study of Multi-Agent Deep Reinforcement Learning for Safe and Robust Autonomous Highway Ramp Entry
- Beyond Joint Demonstrations: Personalized Expert Guidance for Efficient Multi-Agent Reinforcement Learning
-
最近のコメント
表示できるコメントはありません。 cs.AI (30057) cs.CL (22703) cs.CR (2332) cs.CV (36430) cs.LG (34881) cs.RO (17454) cs.SY (2679) eess.IV (4437) eess.SY (2673) stat.ML (4648)
月別アーカイブ: 2024年5月
Faster Cascades via Speculative Decoding
要約 カスケードと投機的デコードは、言語モデルの推論効率を向上させる 2 つの一 … 続きを読む
Weak-to-Strong Search: Align Large Language Models via Searching over Small Language Models
要約 大規模な言語モデルは通常、人間の好みに合わせて微調整されます。 ただし、大 … 続きを読む
Optimizing Foundation Model Inference on a Many-tiny-core Open-source RISC-V Platform
要約 トランスフォーマーベースの基盤モデルは、さまざまな分野、特に自然言語処理 … 続きを読む
Measuring and Mitigating Bias for Tabular Datasets with Multiple Protected Attributes
要約 欧州連合における AI 法の最新の正誤表の発表 (67) を動機として、私 … 続きを読む
Language Models Trained to do Arithmetic Predict Human Risky and Intertemporal Choice
要約 人間と大規模言語モデル (LLM) の動作で観察された類似点により、研究者 … 続きを読む
Adaptive Generalized Neyman Allocation: Local Asymptotic Minimax Optimal Best Arm Identification
要約 この研究では、固定予算のベストアーム同定 (BAI) のための局所漸近ミニ … 続きを読む
Value-Incentivized Preference Optimization: A Unified Approach to Online and Offline RLHF
要約 ヒューマン フィードバックからの強化学習 (RLHF) は、大規模言語モデ … 続きを読む
Are Large Language Models Chameleons?
要約 大規模言語モデル (LLM) には独自の世界観や性格傾向がありますか? L … 続きを読む
Center-Based Relaxed Learning Against Membership Inference Attacks
要約 メンバーシップ推論攻撃 (MIA) は現在、主要なプライバシー攻撃戦略の … 続きを読む