-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
TIFeD: a Tiny Integer-based Federated learning algorithm with Direct feedback alignment
要約 極度にリソースに制約のあるデバイス上で機械および深層学習モデルを直接トレー … 続きを読む
Interpolating neural network: A novel unification of machine learning and interpolation theory
要約 人工知能 (AI) はソフトウェア開発に革命をもたらし、タスク固有のコード … 続きを読む
Characterized Diffusion Networks for Enhanced Autonomous Driving Trajectory Prediction
要約 この論文では、動的で異種の交通環境によってもたらされる課題に対処するために … 続きを読む
Can Learned Optimization Make Reinforcement Learning Less Difficult?
要約 強化学習 (RL) は現実世界での意思決定に大きな可能性を秘めていますが、 … 続きを読む
Tuning Synaptic Connections instead of Weights by Genetic Algorithm in Spiking Policy Network
要約 相互作用から学習することは、生物学的因子が環境と自分自身についての知識を獲 … 続きを読む
OffLight: An Offline Multi-Agent Reinforcement Learning Framework for Traffic Signal Control
要約 効率的な交通制御 (TSC) は都市のモビリティにとって不可欠ですが、従来 … 続きを読む
When Babies Teach Babies: Can student knowledge sharing outperform Teacher-Guided Distillation on small datasets?
要約 データ効率の高い言語モデルの事前トレーニングの限界を押し上げることを目的と … 続きを読む
O1 Replication Journey — Part 2: Surpassing O1-preview through Simple Distillation, Big Progress or Bitter Lesson?
要約 このペーパーでは、OpenAI の O1 モデル機能を複製するための現在の … 続きを読む
Interpreting Language Reward Models via Contrastive Explanations
要約 報酬モデル (RM) は、大規模言語モデル (LLM) の出力を人間の価値 … 続きを読む