cs.LG」カテゴリーアーカイブ

Learning Decentralized Swarms Using Rotation Equivariant Graph Neural Networks

要約 集中制御なしで集合的な目標を最適化するエージェントのオーケストレーションは … 続きを読む

カテゴリー: (Primary), 68Q32, 68T42, cs.LG, cs.RO | Learning Decentralized Swarms Using Rotation Equivariant Graph Neural Networks はコメントを受け付けていません

The FFT Strikes Back: An Efficient Alternative to Self-Attention

要約 従来の自己関節メカニズムには二次の複雑さが発生し、長いシーケンスでのスケー … 続きを読む

カテゴリー: cs.LG | The FFT Strikes Back: An Efficient Alternative to Self-Attention はコメントを受け付けていません

Small Language Models: Survey, Measurements, and Insights

要約 小言語モデル(SLM)は、最新のスマートデバイスでの広範な採用にもかかわら … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Small Language Models: Survey, Measurements, and Insights はコメントを受け付けていません

Learning Decentralized Swarms Using Rotation Equivariant Graph Neural Networks

要約 集中制御なしで集合的な目標を最適化するエージェントのオーケストレーションは … 続きを読む

カテゴリー: (Primary), 68Q32, 68T42, cs.LG, cs.RO | Learning Decentralized Swarms Using Rotation Equivariant Graph Neural Networks はコメントを受け付けていません

Steering Your Generalists: Improving Robotic Foundation Models via Value Guidance

要約 多様なデモンストレーションデータセットで訓練された大規模な汎用ロボットポリ … 続きを読む

カテゴリー: cs.LG, cs.RO | Steering Your Generalists: Improving Robotic Foundation Models via Value Guidance はコメントを受け付けていません

A Survey of Sim-to-Real Methods in RL: Progress, Prospects and Challenges with Foundation Models

要約 ディープ強化学習(RL)は、ロボット工学、輸送、推奨システムなど、さまざま … 続きを読む

カテゴリー: 68T05, 68U05, cs.AI, cs.LG, cs.RO, I.2.1 | A Survey of Sim-to-Real Methods in RL: Progress, Prospects and Challenges with Foundation Models はコメントを受け付けていません

Toward 6-DOF Autonomous Underwater Vehicle Energy-Aware Position Control based on Deep Reinforcement Learning: Preliminary Results

要約 未開の未開発の水中地域の調査、マッピング、検査のための自律的な水中車両(A … 続きを読む

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | Toward 6-DOF Autonomous Underwater Vehicle Energy-Aware Position Control based on Deep Reinforcement Learning: Preliminary Results はコメントを受け付けていません

Safe Multi-Agent Navigation guided by Goal-Conditioned Safe Reinforcement Learning

要約 安全なナビゲーションは、危険な環境で動作する自律システムに不可欠です。 従 … 続きを読む

カテゴリー: cs.LG, cs.RO | Safe Multi-Agent Navigation guided by Goal-Conditioned Safe Reinforcement Learning はコメントを受け付けていません

CAML: Collaborative Auxiliary Modality Learning for Multi-Agent Systems

要約 マルチモダリティ学習は、自律運転、ロボット工学、知覚システムなどのドメイン … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | CAML: Collaborative Auxiliary Modality Learning for Multi-Agent Systems はコメントを受け付けていません

ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization

要約 報酬形状は、特にまばらな報酬が学習を妨げる複雑なタスクでは、強化学習(RL … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization はコメントを受け付けていません