SYNAPSE: SYmbolic Neural-Aided Preference Synthesis Engine

要約

この論文は、視覚的なデモンストレーションからユーザー固有の好み (例: 「適切な車寄せ位置」) を学習することでロボットの動作を調整することを目的とした好み学習の問題に取り組んでいます。
事実に基づく概念の学習(例:「赤いドア」)と類似しているにもかかわらず、嗜好学習は、その主観的な性質と個人固有のトレーニング データの不足により、基本的により困難な問題です。
私たちは、限られたデータから優先的な概念を効率的に学習するように設計された神経記号的アプローチである SYNAPSE と呼ばれる新しいフレームワークを使用して、この問題に対処します。
SYNAPSE は、画像に対して動作し、視覚的解析、大規模言語モデル、およびプログラム合成の新しい組み合わせを活用して、表現するプログラムを学習するドメイン固有言語 (DSL) で、好みを神経記号プログラムとして表現し、調整のための個々の部品の検査を容易にします。
個人の好み。
当社は、さまざまな優先概念や、異なるユーザーの好みにうまく適合する能力を実証するユーザー事例研究について広範な評価を実行します。
私たちの方法は、特に分布外の一般化に関して、ベースラインを大幅に上回ります。
私たちは、複数のアブレーション研究を通じて、フレームワークにおける設計選択の重要性を示しています。
コード、追加の結果、補足資料は、Web サイト https://amrl.cs.utexas.edu/synapse にあります。

要約(オリジナル)

This paper addresses the problem of preference learning, which aims to align robot behaviors through learning user specific preferences (e.g. ‘good pull-over location’) from visual demonstrations. Despite its similarity to learning factual concepts (e.g. ‘red door’), preference learning is a fundamentally harder problem due to its subjective nature and the paucity of person-specific training data. We address this problem using a novel framework called SYNAPSE, which is a neuro-symbolic approach designed to efficiently learn preferential concepts from limited data. SYNAPSE represents preferences as neuro-symbolic programs, facilitating inspection of individual parts for alignment, in a domain-specific language (DSL) that operates over images and leverages a novel combination of visual parsing, large language models, and program synthesis to learn programs representing individual preferences. We perform extensive evaluations on various preferential concepts as well as user case studies demonstrating its ability to align well with dissimilar user preferences. Our method significantly outperforms baselines, especially when it comes to out of distribution generalization. We show the importance of the design choices in the framework through multiple ablation studies. Code, additional results, and supplementary material can be found on the website: https://amrl.cs.utexas.edu/synapse

arxiv情報

著者 Sadanand Modak,Noah Patton,Isil Dillig,Joydeep Biswas
発行日 2025-01-14 21:37:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.PL, cs.RO パーマリンク