-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Learning Generalized Hamiltonians using fully Symplectic Mappings
要約 多くの重要な物理システムは、保守的であるという重要な特性を持っているハミル … 続きを読む
AFD-STA: Adaptive Filtering Denoising with Spatiotemporal Attention for Chaotic System Prediction
要約 このホワイトペーパーでは、部分的な微分方程式によって支配された高次元のカオ … 続きを読む
Backpropagation-Free Metropolis-Adjusted Langevin Algorithm
要約 Backpropagationのない学習に関する最近の研究により、Forw … 続きを読む
Stable Reinforcement Learning for Efficient Reasoning
要約 DeepSeek-R1の成功により、GRPOなどの強化学習(RL)方法に対 … 続きを読む
An alignment safety case sketch based on debate
要約 AIシステムが幅広いタスクで人間の能力に一致するか、それを超えると、人間が … 続きを読む
カテゴリー: cs.AI
An alignment safety case sketch based on debate はコメントを受け付けていません
Data Mixing Can Induce Phase Transitions in Knowledge Acquisition
要約 大規模な言語モデル(LLM)は通常、データの混合物でトレーニングされていま … 続きを読む
Planning without Search: Refining Frontier LLMs with Offline Goal-Conditioned RL
要約 大規模な言語モデル(LLM)は、質問の回答や対話などのタスクで優れています … 続きを読む
How Can I Publish My LLM Benchmark Without Giving the True Answers Away?
要約 インターネット上の大規模な言語モデル(LLM)ベンチマークを公開することは … 続きを読む
Activated LoRA: Fine-tuned LLMs for Intrinsics
要約 低ランク適応(LORA)は、大規模な基礎モデルの重みを微調整するための非常 … 続きを読む
Bidirectional Knowledge Distillation for Enhancing Sequential Recommendation with Large Language Models
要約 大規模な言語モデル(LLMS)は、セマンティックパターンの理解と生成におい … 続きを読む