「cs.LG」カテゴリーアーカイブ

Learning Decentralized Swarms Using Rotation Equivariant Graph Neural Networks

投稿日: 2025年2月27日作成者: jarxiv

要約集中制御なしで集合的な目標を最適化するエージェントのオーケストレーションは … 続きを読む →

カテゴリー: (Primary), 68Q32, 68T42, cs.LG, cs.RO | コメントを受け付けていません

The FFT Strikes Back: An Efficient Alternative to Self-Attention

投稿日: 2025年2月27日作成者: jarxiv

要約従来の自己関節メカニズムには二次の複雑さが発生し、長いシーケンスでのスケー … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Small Language Models: Survey, Measurements, and Insights

投稿日: 2025年2月27日作成者: jarxiv

要約小言語モデル（SLM）は、最新のスマートデバイスでの広範な採用にもかかわら … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Learning Decentralized Swarms Using Rotation Equivariant Graph Neural Networks

投稿日: 2025年2月26日作成者: jarxiv

要約集中制御なしで集合的な目標を最適化するエージェントのオーケストレーションは … 続きを読む →

カテゴリー: (Primary), 68Q32, 68T42, cs.LG, cs.RO | コメントを受け付けていません

Steering Your Generalists: Improving Robotic Foundation Models via Value Guidance

投稿日: 2025年2月26日作成者: jarxiv

要約多様なデモンストレーションデータセットで訓練された大規模な汎用ロボットポリ … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

A Survey of Sim-to-Real Methods in RL: Progress, Prospects and Challenges with Foundation Models

投稿日: 2025年2月26日作成者: jarxiv

要約ディープ強化学習（RL）は、ロボット工学、輸送、推奨システムなど、さまざま … 続きを読む →

カテゴリー: 68T05, 68U05, cs.AI, cs.LG, cs.RO, I.2.1 | コメントを受け付けていません

Toward 6-DOF Autonomous Underwater Vehicle Energy-Aware Position Control based on Deep Reinforcement Learning: Preliminary Results

投稿日: 2025年2月26日作成者: jarxiv

要約未開の未開発の水中地域の調査、マッピング、検査のための自律的な水中車両（A … 続きを読む →

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | コメントを受け付けていません

Safe Multi-Agent Navigation guided by Goal-Conditioned Safe Reinforcement Learning

投稿日: 2025年2月26日作成者: jarxiv

要約安全なナビゲーションは、危険な環境で動作する自律システムに不可欠です。従 … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

CAML: Collaborative Auxiliary Modality Learning for Multi-Agent Systems

投稿日: 2025年2月26日作成者: jarxiv

要約マルチモダリティ学習は、自律運転、ロボット工学、知覚システムなどのドメイン … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization

投稿日: 2025年2月26日作成者: jarxiv

要約報酬形状は、特にまばらな報酬が学習を妨げる複雑なタスクでは、強化学習（RL … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Learning Decentralized Swarms Using Rotation Equivariant Graph Neural Networks

The FFT Strikes Back: An Efficient Alternative to Self-Attention

Small Language Models: Survey, Measurements, and Insights

Learning Decentralized Swarms Using Rotation Equivariant Graph Neural Networks

Steering Your Generalists: Improving Robotic Foundation Models via Value Guidance

A Survey of Sim-to-Real Methods in RL: Progress, Prospects and Challenges with Foundation Models

Toward 6-DOF Autonomous Underwater Vehicle Energy-Aware Position Control based on Deep Reinforcement Learning: Preliminary Results

Safe Multi-Agent Navigation guided by Goal-Conditioned Safe Reinforcement Learning

CAML: Collaborative Auxiliary Modality Learning for Multi-Agent Systems

ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization

最近の投稿

最近のコメント

アーカイブ

カテゴリー