要約
研究者が人工知能技術の開発を通じて機械知能と人間の間のギャップを縮めようと努めている中で、誰もが日常生活のあらゆる側面に遍在するようになったオープンワールドにおける信頼性の極めて重要性を認識することが不可欠です。
ただし、いくつかの課題により、現在の人工知能システムの信頼に危機が生じる可能性があり、それを乗り越える必要があります。 1) 予測結果の説明が不十分。
2) 学習モデルの一般化が不十分。
3) 不確実な環境への適応力が低い。
その結果、私たちは信頼性とオープンワールド学習の橋渡しをするニューラル プログラムを探索し、読者にとってシングルモーダル シナリオからマルチモーダル シナリオまで拡張します。
1) 設計レベルの解釈可能性を高めるために、まず信頼できるネットワークを特定の物理的意味でカスタマイズします。
2) 次に、信頼できる学習の一般化を向上させるために、柔軟な学習正則化機能を介して環境福祉タスク インターフェイスを設計します。
3) オープンワールドの認識損失をエージェントメカニズムと統合することにより、信頼できる学習の堅牢性を高めることを提案します。
最終的には、設計レベルの説明可能性、環境福祉タスクインターフェイス、オープンワールド認識プログラムの確立を通じて、さまざまな信頼できる特性を強化します。
これらの設計されたオープンワールド プロトコルは、オープンワールド マルチメディア認識シナリオの下で、広範囲の環境に適用でき、パフォーマンスの大幅な向上が観察されます。
要約(オリジナル)
As researchers strive to narrow the gap between machine intelligence and human through the development of artificial intelligence technologies, it is imperative that we recognize the critical importance of trustworthiness in open-world, which has become ubiquitous in all aspects of daily life for everyone. However, several challenges may create a crisis of trust in current artificial intelligence systems that need to be bridged: 1) Insufficient explanation of predictive results; 2) Inadequate generalization for learning models; 3) Poor adaptability to uncertain environments. Consequently, we explore a neural program to bridge trustworthiness and open-world learning, extending from single-modal to multi-modal scenarios for readers. 1) To enhance design-level interpretability, we first customize trustworthy networks with specific physical meanings; 2) We then design environmental well-being task-interfaces via flexible learning regularizers for improving the generalization of trustworthy learning; 3) We propose to increase the robustness of trustworthy learning by integrating open-world recognition losses with agent mechanisms. Eventually, we enhance various trustworthy properties through the establishment of design-level explainability, environmental well-being task-interfaces and open-world recognition programs. These designed open-world protocols are applicable across a wide range of surroundings, under open-world multimedia recognition scenarios with significant performance improvements observed.
arxiv情報
著者 | Shide Du,Zihan Fang,Shiyang Lan,Yanchao Tan,Manuel Günther,Shiping Wang,Wenzhong Guo |
発行日 | 2023-09-27 15:28:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google