要約
大規模な機械学習における最近の進歩により、幅広いダウンストリームタスクに適応できる大容量の基礎モデルが生まれました。
このようなモデルはロボット工学に大きな期待を抱いていますが、一般的なパラダイムは、ロボットを依然として単一の自律的な意思決定者として描写し、操作やナビゲーションなどのタスクを実行し、人間の関与が限られています。
ただし、ウェアラブルロボット工学(補綴物、装具、エクソスケルトンなど)、テレオ操作、神経界面などの、実世界のロボットシステムの大規模なクラスは半自動化されており、人間のパートナーとの継続的なインタラクティブな調整が必要であり、単一エージェントの仮定に挑戦します。
このポジションペーパーでは、ロボットファンデーションモデルは、リアルタイムのヒューマンロボットの共適応の複雑さを処理するために、インタラクティブなマルチエージェントの視点に進化しなければならないと主張します。
4つのモジュールを含む一般化可能な神経科学にインスパイアされたアーキテクチャを提案します。(1)感覚運動統合原則によって通知されるマルチモーダルセンシングモジュール、(2)認知科学における関節型枠組みを連想させるアドホックチームワークモデル、(3)予測
運動制御の内部モデル理論に基づいた世界の信念モデル、および(4)ヘビアンと強化ベースの可塑性の概念をエコーするメモリ/フィードバックメカニズム。
ウェアラブルデバイスと人間の生理学が不可分に絡み合っているサイボーグシステムのレンズを通して示されていますが、提案されたフレームワークは、半自律的またはインタラクティブなコンテキストで動作するロボットに広く適用できます。
シングルエージェントデザインを超えて移動することにより、私たちの立場は、ロボット工学の基礎モデルが、より堅牢でパーソナライズされ、予測的なレベルのパフォーマンスをどのように達成できるかを強調しています。
要約(オリジナル)
Recent advances in large-scale machine learning have produced high-capacity foundation models capable of adapting to a broad array of downstream tasks. While such models hold great promise for robotics, the prevailing paradigm still portrays robots as single, autonomous decision-makers, performing tasks like manipulation and navigation, with limited human involvement. However, a large class of real-world robotic systems, including wearable robotics (e.g., prostheses, orthoses, exoskeletons), teleoperation, and neural interfaces, are semiautonomous, and require ongoing interactive coordination with human partners, challenging single-agent assumptions. In this position paper, we argue that robot foundation models must evolve to an interactive multi-agent perspective in order to handle the complexities of real-time human-robot co-adaptation. We propose a generalizable, neuroscience-inspired architecture encompassing four modules: (1) a multimodal sensing module informed by sensorimotor integration principles, (2) an ad-hoc teamwork model reminiscent of joint-action frameworks in cognitive science, (3) a predictive world belief model grounded in internal model theories of motor control, and (4) a memory/feedback mechanism that echoes concepts of Hebbian and reinforcement-based plasticity. Although illustrated through the lens of cyborg systems, where wearable devices and human physiology are inseparably intertwined, the proposed framework is broadly applicable to robots operating in semi-autonomous or interactive contexts. By moving beyond single-agent designs, our position emphasizes how foundation models in robotics can achieve a more robust, personalized, and anticipatory level of performance.
arxiv情報
著者 | Sharmita Dey |
発行日 | 2025-02-09 17:13:27+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google