-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Task Vectors are Cross-Modal
要約 私たちは、視覚と言語モデル (VLM) の内部表現と、VLM がタスク表現 … 続きを読む
Local Policies Enable Zero-shot Long-horizon Manipulation
要約 ロボット操作用の Sim2real は、複雑な接触をシミュレートし、現実的 … 続きを読む
EMOCPD: Efficient Attention-based Models for Computational Protein Design Using Amino Acid Microenvironment
要約 計算タンパク質設計 (CPD) とは、タンパク質を設計するための計算手法の … 続きを読む
An Effective Theory of Bias Amplification
要約 機械学習モデルはデータに存在するバイアスを捉えて増幅する可能性があり、その … 続きを読む
Aligning Text-to-Image Diffusion Models with Reward Backpropagation
要約 テキストから画像への拡散モデルは、非常に大規模な教師なしまたは弱く教師付き … 続きを読む
RadarOcc: Robust 3D Occupancy Prediction with 4D Imaging Radar
要約 3D 占有ベースの認識パイプラインは、詳細なシーンの説明をキャプチャし、さ … 続きを読む
Adversarial Constrained Policy Optimization: Improving Constrained Reinforcement Learning by Adapting Budgets
要約 制約付き強化学習は、報酬と制約の両方が考慮される安全性が重要な分野で有望な … 続きを読む
AI Olympics challenge with Evolutionary Soft Actor Critic
要約 次のレポートでは、IROS 2024 で開催される AI オリンピック競技 … 続きを読む
RIME: Robust Preference-based Reinforcement Learning with Noisy Preferences
要約 好みに基づく強化学習 (PbRL) は、人間の好みを報酬シグナルとして利用 … 続きを読む
Reference-Free Formula Drift with Reinforcement Learning: From Driving Data to Tire Energy-Inspired, Real-World Policies
要約 車をドリフトさせるスキル、つまりプロのドライバーのように制御されたオーバー … 続きを読む