-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Entropy Controllable Direct Preference Optimization
要約 大規模な言語モデル(LLM)の訓練後、人間のフィードバック(RLHF)から … 続きを読む
Long-Short Alignment for Effective Long-Context Modeling in LLMs
要約 大規模な言語モデル(LLM)は、印象的なパフォーマンスと驚くべき緊急特性を … 続きを読む
Persona-driven Simulation of Voting Behavior in the European Parliament with Large Language Models
要約 大規模な言語モデル(LLMS)は、政治的言説を理解したり、生み出したりする … 続きを読む
Word Sense Detection Leveraging Maximum Mean Discrepancy
要約 単語感覚分析は、言語的および社会的背景を解釈するための重要な分析作業です。 … 続きを読む
On the Performance of LLMs for Real Estate Appraisal
要約 不動産市場は世界経済にとって不可欠ですが、重要な情報の非対称性に苦しんでい … 続きを読む
TreeRL: LLM Reinforcement Learning with On-Policy Tree Search
要約 ツリー検索を備えた強化学習(RL)は、従来の推論タスクで優れたパフォーマン … 続きを読む
T1: Advancing Language Model Reasoning through Reinforcement Learning and Inference Scaling
要約 大規模な言語モデル(LLMS)は、複雑な推論タスクにおいて顕著な能力を示し … 続きを読む
Factual Knowledge in Language Models: Robustness and Anomalies under Simple Temporal Context Variations
要約 このペーパーでは、実際の知識の中で、時間的文脈の変動に対する言語モデル(L … 続きを読む
e3: Learning to Explore Enables Extrapolation of Test-Time Compute for LLMs
要約 テスト時間スケーリングは、推論時により多くの計算を利用することにより、LL … 続きを読む
V-Max: A Reinforcement Learning Framework for Autonomous Driving
要約 学習ベースの意思決定には、一般化可能な自律運転(AD)ポリシーを可能にする … 続きを読む