Inductive Bias for Emergent Communication in a Continuous Setting

要約

私たちは、エージェントが協力してタスクを解決し、通信チャネルにアクセスできる、マルチエージェント強化学習設定における緊急コミュニケーションを研究します。
通信チャネルは、離散シンボルまたは連続変数のいずれかで構成されます。
連続メッセージ用の優れた通信プロトコルの出現を支援するために帰納的バイアスを導入し、このタイプの帰納的バイアスがそれ自体、または強化学習と組み合わせて使用​​された場合に連続メッセージと離散メッセージに与える影響を調べます。
我々は、このタイプの誘導バイアスが、交渉とシーケンス推測という 2 つのおもちゃの環境で学習された通信プロトコルに有益な効果をもたらすことを実証します。

要約(オリジナル)

We study emergent communication in a multi-agent reinforcement learning setting, where the agents solve cooperative tasks and have access to a communication channel. The communication channel may consist of either discrete symbols or continuous variables. We introduce an inductive bias to aid with the emergence of good communication protocols for continuous messages, and we look at the effect this type of inductive bias has for continuous and discrete messages in itself or when used in combination with reinforcement learning. We demonstrate that this type of inductive bias has a beneficial effect on the communication protocols learnt in two toy environments, Negotiation and Sequence Guess.

arxiv情報

著者 John Isak Fjellvang Villanger,Troels Arnfred Bojesen
発行日 2023-06-06 16:15:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.MA, I.2.11 パーマリンク