-
最近の投稿
- Online Adaptation of Terrain-Aware Dynamics for Planning in Unstructured Environments
- ‘Don’t Do That!’: Guiding Embodied Systems through Large Language Model-based Constraint Generation
- SGN-CIRL: Scene Graph-based Navigation with Curriculum, Imitation, and Reinforcement Learning
- Olfactory Inertial Odometry: Sensor Calibration and Drift Compensation
- Chronoamperometry with Room-Temperature Ionic Liquids: Sub-Second Inference Techniques
-
最近のコメント
表示できるコメントはありません。 cs.AI (39257) cs.CL (29715) cs.CV (44646) cs.HC (2989) cs.LG (44171) cs.RO (23444) cs.SY (3577) eess.IV (5131) eess.SY (3569) stat.ML (5743)
月別アーカイブ: 2025年5月
Enhancing Automated Interpretability with Output-Centric Feature Descriptions
要約 自動化された解釈可能性パイプラインは、植物や文の最初の単語など、大規模な言 … 続きを読む
Understanding Refusal in Language Models with Sparse Autoencoders
要約 拒否は、整合した言語モデルの重要な安全行動ですが、拒否を促進する内部メカニ … 続きを読む
LEXam: Benchmarking Legal Reasoning on 340 Law Exams
要約 テスト時間スケーリングの最近の進歩にもかかわらず、長い形式の法的推論は依然 … 続きを読む
Segment Policy Optimization: Effective Segment-Level Credit Assignment in RL for Large Language Models
要約 強化学習(RL)を使用して効果的に大規模な言語モデルの推論能力を強化するこ … 続きを読む
Evaluating AI capabilities in detecting conspiracy theories on YouTube
要約 膨大なグローバルな視聴者を持つ大手オンラインプラットフォームとして、You … 続きを読む
Multi-Domain Explainability of Preferences
要約 人間の好み、LLM-as-a-a-judge(laaj)、報酬モデルなどの … 続きを読む
On-Policy RL with Optimal Reward Baseline
要約 強化学習アルゴリズムは、大規模な言語モデルを人間の好みに合わせて、推論能力 … 続きを読む
Jigsaw-R1: A Study of Rule-based Visual Reinforcement Learning with Jigsaw Puzzles
要約 ルールベースの強化学習(RL)をマルチモーダル大手言語モデル(MLLMS) … 続きを読む
X-TURING: Towards an Enhanced and Efficient Turing Test for Long-Term Dialogue Agents
要約 チューリングテストでは、AISが自然言語の会話で人間のような行動を示すかど … 続きを読む