-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年2月
Universal Jailbreak Backdoors from Poisoned Human Feedback
要約 ヒューマン フィードバックからの強化学習 (RLHF) は、大規模な言語モ … 続きを読む
PaDeLLM-NER: Parallel Decoding in Large Language Models for Named Entity Recognition
要約 この研究では、大規模言語モデル (LLM) を使用した固有表現認識 (NE … 続きを読む
Explaining Learned Reward Functions with Counterfactual Trajectories
要約 人間の行動やフィードバックから報酬を学習することは、AI システムを人間の … 続きを読む
CodeIt: Self-Improving Language Models with Prioritized Hindsight Replay
要約 大規模な言語モデルは、人間レベルの推論能力が必要と一般に考えられているタス … 続きを読む
Learning by Doing: An Online Causal Reinforcement Learning Framework with Causal-Aware Policy
要約 人間の知能における直観的な認知および推論ソリューションの重要な要素として、 … 続きを読む
DS-MS-TCN: Otago Exercises Recognition with a Dual-Scale Multi-Stage Temporal Convolutional Network
要約 オタゴ運動プログラム (OEP) は、バランスと筋力の強化を目的とした、高 … 続きを読む
A Unified Framework for Probabilistic Verification of AI Systems via Weighted Model Integration
要約 AI システムの確率的形式検証 (PFV) はまだ初期段階にあります。 こ … 続きを読む
The Strain of Success: A Predictive Model for Injury Risk Mitigation and Team Success in Soccer
要約 この論文では、サッカーにおける新しい逐次チーム選択モデルを紹介します。 具 … 続きを読む
Imitation Learning from Observation with Automatic Discount Scheduling
要約 人間は観察と模倣を通じて新しいスキルを獲得することがよくあります。 ロボッ … 続きを読む
Prompting Implicit Discourse Relation Annotation
要約 ChatGPT などの事前トレーニング済みの大規模言語モデルは、教師付きト … 続きを読む