Bellman Unbiasedness: Tractable and Provably Efficient Distributional Reinforcement Learning with General Value Function Approximation

要約

分布補強学習は、環境の確率性を捉えることでパフォーマンスを向上させますが、その有効性の包括的な理論的理解はとらえどころのないままです。
さらに、分布の無限の次元の扱いにくい要素は見落とされています。
このホワイトペーパーでは、有限のエピソードマルコフ決定プロセスの設定で、一般的な値関数近似を伴う分布補強学習の後悔分析を提示します。
最初に、$ \ textit {bellman unviasedness} $の重要な概念を紹介します。
無限の次元のリターン分布を表すためのあらゆるタイプの統計的機能の中で、我々の理論的結果は、モーメント機能のみが統計情報を正確にキャプチャできることを示しています。
第二に、$ \ tilde {o}(d_e h^{\ frac {3} {2}}}}} \ sqrt {k})の厳しい後悔の境界を達成する、$ \ tildtt {sf-lsvi} $を達成する$ \ texttt {sf-lsvi} $を提案します。
関数クラスのEveruderディメンションです。

要約(オリジナル)

Distributional reinforcement learning improves performance by capturing environmental stochasticity, but a comprehensive theoretical understanding of its effectiveness remains elusive. In addition, the intractable element of the infinite dimensionality of distributions has been overlooked. In this paper, we present a regret analysis of distributional reinforcement learning with general value function approximation in a finite episodic Markov decision process setting. We first introduce a key notion of $\textit{Bellman unbiasedness}$ which is essential for exactly learnable and provably efficient distributional updates in an online manner. Among all types of statistical functionals for representing infinite-dimensional return distributions, our theoretical results demonstrate that only moment functionals can exactly capture the statistical information. Secondly, we propose a provably efficient algorithm, $\texttt{SF-LSVI}$, that achieves a tight regret bound of $\tilde{O}(d_E H^{\frac{3}{2}}\sqrt{K})$ where $H$ is the horizon, $K$ is the number of episodes, and $d_E$ is the eluder dimension of a function class.

arxiv情報

著者 Taehyun Cho,Seungyub Han,Kyungjae Lee,Seokhun Ju,Dohyeong Kim,Jungwoo Lee
発行日 2025-05-06 15:02:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.ML | Bellman Unbiasedness: Tractable and Provably Efficient Distributional Reinforcement Learning with General Value Function Approximation はコメントを受け付けていません

Survival Analysis with Machine Learning for Predicting Li-ion Battery Remaining Useful Life

要約

バッテリーの劣化は、特に電気自動車や産業用途におけるエネルギー貯蔵システムの信頼性と効率に大きく影響します。
リチウムイオン電池の残りの耐用年数(RUL)を予測することは、メンテナンススケジュールの最適化、コストの削減、安全性の向上に不可欠です。
従来のルール予測方法は、しばしば非線形分解パターンと不確実性の定量化に苦しんでいます。
これらの課題に対処するために、生存データの再構築、生存モデルの学習、生存確率推定を統合するハイブリッドサバイバル分析フレームワークを提案します。
当社のアプローチは、バッテリー電圧時系列をパスシグネチャを使用して、時間から障害のデータに変換します。
COXベースの複数のサバイバルモデルと、DeepHitやMTLRなどのマシンラーニングベースの方法は、バッテリーの障害のない確率を時間の経過とともに予測することを学びます。
トヨタバッテリーとNASAバッテリーデータセットで実施された実験は、私たちのアプローチの有効性を示し、低い統合されたBrierスコアを維持しながら、高時間依存のAUCおよび一致インデックス(C-Index)を達成します。
この作業のデータとソースコードは、https://github.com/thinkxca/rulで一般に利用できます。

要約(オリジナル)

Battery degradation significantly impacts the reliability and efficiency of energy storage systems, particularly in electric vehicles and industrial applications. Predicting the remaining useful life (RUL) of lithium-ion batteries is crucial for optimizing maintenance schedules, reducing costs, and improving safety. Traditional RUL prediction methods often struggle with nonlinear degradation patterns and uncertainty quantification. To address these challenges, we propose a hybrid survival analysis framework integrating survival data reconstruction, survival model learning, and survival probability estimation. Our approach transforms battery voltage time series into time-to-failure data using path signatures. The multiple Cox-based survival models and machine-learning-based methods, such as DeepHit and MTLR, are learned to predict battery failure-free probabilities over time. Experiments conducted on the Toyota battery and NASA battery datasets demonstrate the effectiveness of our approach, achieving high time-dependent AUC and concordance index (C-Index) while maintaining a low integrated Brier score. The data and source codes for this work are available to the public at https://github.com/thinkxca/rul.

arxiv情報

著者 Jingyuan Xue,Longfei Wei,Dongjing Jiang,Fang Sheng,Russell Greiner,Jianfei Zhang
発行日 2025-05-06 15:28:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, eess.SP | Survival Analysis with Machine Learning for Predicting Li-ion Battery Remaining Useful Life はコメントを受け付けていません

DEFT: Differentiable Branched Discrete Elastic Rods for Modeling Furcated DLOs in Real-Time

要約

自律ワイヤーハーネスアセンブリには、高精度と信頼性で複雑な分岐ケーブルを操作するためにロボットが必要です。
このプロセスを自動化する上での重要な課題は、これらの柔軟な構造と分岐構造が操作中にどのように振る舞うかを予測することです。
正確な予測がなければ、ロボットが組み立て操作を確実に計画または実行することは困難です。
既存の研究により、単一スレッドの変形可能な線形オブジェクト(DLOS)のモデリングが進歩しましたが、これらのアプローチを分岐した変形可能な線形オブジェクト(BDLOS)に拡張することは、基本的な課題を提示します。
BDLOSのジャンクションポイントは、複数のシングルドロモデルを接続するだけでは適切にキャプチャできない複雑な力の相互作用とひずみ伝播パターンを作成します。
これらの課題に対処するために、このペーパーでは、差別化可能な物理学ベースのモデルと学習フレームワークを組み合わせた新しいフレームワークである縁石のDLOSをリアルタイム(DEFT)でモデル化するための差別化可能な離散分岐弾性ロッドを提示します。
BDLO操作。
包括的な一連の実世界の実験は、最先端の代替案と比較した精度、計算速度、および一般化可能性の観点からDeftの有効性を示しています。
プロジェクトページ:https://roahmlab.github.io/deft/。

要約(オリジナル)

Autonomous wire harness assembly requires robots to manipulate complex branched cables with high precision and reliability. A key challenge in automating this process is predicting how these flexible and branched structures behave under manipulation. Without accurate predictions, it is difficult for robots to reliably plan or execute assembly operations. While existing research has made progress in modeling single-threaded Deformable Linear Objects (DLOs), extending these approaches to Branched Deformable Linear Objects (BDLOs) presents fundamental challenges. The junction points in BDLOs create complex force interactions and strain propagation patterns that cannot be adequately captured by simply connecting multiple single-DLO models. To address these challenges, this paper presents Differentiable discrete branched Elastic rods for modeling Furcated DLOs in real-Time (DEFT), a novel framework that combines a differentiable physics-based model with a learning framework to: 1) accurately model BDLO dynamics, including dynamic propagation at junction points and grasping in the middle of a BDLO, 2) achieve efficient computation for real-time inference, and 3) enable planning to demonstrate dexterous BDLO manipulation. A comprehensive series of real-world experiments demonstrates DEFT’s efficacy in terms of accuracy, computational speed, and generalizability compared to state-of-the-art alternatives. Project page:https://roahmlab.github.io/DEFT/.

arxiv情報

著者 Yizhou Chen,Xiaoyue Wu,Yeheng Zong,Yuzhen Chen,Anran Li,Bohao Zhang,Ram Vasudevan
発行日 2025-05-06 15:36:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.GR, cs.RO | DEFT: Differentiable Branched Discrete Elastic Rods for Modeling Furcated DLOs in Real-Time はコメントを受け付けていません

Synthesizing Images on Perceptual Boundaries of ANNs for Uncovering and Manipulating Human Perceptual Variability

要約

認知タスクと日常生活における人間の意思決定は、タスクの難易度、個々の好み、個人的な経験などの要因によって形作られるかなりのばらつきを示します。
個人間のこの変動性を理解することは、不確実性と曖昧さに直面したときに人間が依存している知覚的および意思決定メカニズムを明らかにするために不可欠です。
ANNの知覚的境界サンプリングと人間の行動実験を組み合わせて、この現象を体系的に調査する計算フレームワークBAM(境界アライメントおよび操作フレームワーク)を提示します。
私たちの知覚境界サンプリングアルゴリズムは、ANNの決定境界に沿って刺激を生成し、本質的に有意な知覚的変動を誘導します。
これらの刺激の有効性は、116,715の試験で246人の参加者を含む大規模な行動実験を通じて経験的に検証され、19,943の系統的に注釈された画像を含むバリムニストデータセットで頂点に達します。
パーソナライズされたモデルのアライメントと敵対的な生成を通じて、参加者のペアの多様な知覚的決定を同時に予測および操作するための信頼できる方法を確立します。
この作業は、計算モデルと人間の個人差の研究とのギャップを橋渡しし、パーソナライズされた知覚分析のための新しいツールを提供します。

要約(オリジナル)

Human decision-making in cognitive tasks and daily life exhibits considerable variability, shaped by factors such as task difficulty, individual preferences, and personal experiences. Understanding this variability across individuals is essential for uncovering the perceptual and decision-making mechanisms that humans rely on when faced with uncertainty and ambiguity. We present a computational framework BAM (Boundary Alignment & Manipulation framework) that combines perceptual boundary sampling in ANNs and human behavioral experiments to systematically investigate this phenomenon. Our perceptual boundary sampling algorithm generates stimuli along ANN decision boundaries that intrinsically induce significant perceptual variability. The efficacy of these stimuli is empirically validated through large-scale behavioral experiments involving 246 participants across 116,715 trials, culminating in the variMNIST dataset containing 19,943 systematically annotated images. Through personalized model alignment and adversarial generation, we establish a reliable method for simultaneously predicting and manipulating the divergent perceptual decisions of pairs of participants. This work bridges the gap between computational models and human individual difference research, providing new tools for personalized perception analysis.

arxiv情報

著者 Chen Wei,Chi Zhang,Jiachen Zou,Haotian Deng,Dietmar Heinke,Quanying Liu
発行日 2025-05-06 15:44:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI | Synthesizing Images on Perceptual Boundaries of ANNs for Uncovering and Manipulating Human Perceptual Variability はコメントを受け付けていません

BURNS: Backward Underapproximate Reachability for Neural-Feedback-Loop Systems

要約

学習対応の計画および制御アルゴリズムはますます一般的になっていますが、パフォーマンスや安全性の厳密な保証が不足していることがよくあります。
非線形の離散時間ニューラルフィードバックループの過小輝く後方到達可能な到達可能なセットを計算するためのアルゴリズムを紹介します。
次に、後方に到達可能なセットを使用して、目標到達プロパティを確認します。
私たちのアルゴリズムは、システムダイナミクス関数を過度に近接して、混合整数線形プログラムのソリューションを介して、概算の下方到達可能な到達可能なセットの計算を可能にすることに基づいています。
アルゴリズムの健全性を厳密に分析し、数値の例で実証します。
私たちの作業は、学習対応システム用に検証できるプロパティのクラスを拡張します。

要約(オリジナル)

Learning-enabled planning and control algorithms are increasingly popular, but they often lack rigorous guarantees of performance or safety. We introduce an algorithm for computing underapproximate backward reachable sets of nonlinear discrete time neural feedback loops. We then use the backward reachable sets to check goal-reaching properties. Our algorithm is based on overapproximating the system dynamics function to enable computation of underapproximate backward reachable sets through solutions of mixed-integer linear programs. We rigorously analyze the soundness of our algorithm and demonstrate it on a numerical example. Our work expands the class of properties that can be verified for learning-enabled systems.

arxiv情報

著者 Chelsea Sidrane,Jana Tumova
発行日 2025-05-06 15:50:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LO, cs.SY, eess.SY | BURNS: Backward Underapproximate Reachability for Neural-Feedback-Loop Systems はコメントを受け付けていません

HardML: A Benchmark For Evaluating Data Science And Machine Learning knowledge and reasoning in AI

要約

データサイエンスと機械学習の分野における知識と推論能力を評価するために設計されたベンチマークであるHardMLを提示します。
HARDMLは、6か月間にわたって手作りされた100の挑戦的な多様な質問の多様なセットで構成され、データサイエンスと機械学習の最も人気のある最新の分野をカバーしています。
これらの質問は、典型的な上級機械学習エンジニアが正しく答えることでさえ挑戦的です。
データ汚染のリスクを最小限に抑えるために、HardMLは著者によって考案された主に元のコンテンツを使用します。
現在の最先端のAIモデルは、このベンチマークで30%のエラー率を達成します。これは、同等のよく知られているMMLU MLで達成されたベンチマークの約3倍です。
HardMLは範囲が制限されており、主にその多肢選択の性質のためにフロンティアをプッシュすることを目指していませんが、トップAIの進行を定量化および追跡するための厳格で最新のテストベッドとして機能します。
LLM評価の多くのベンチマークと実験は、数学、物理学、化学などの他のSTEM分野に存在しますが、データサイエンスと機械学習のサブフィールドはかなり目立たないままです。

要約(オリジナル)

We present HardML, a benchmark designed to evaluate the knowledge and reasoning abilities in the fields of data science and machine learning. HardML comprises a diverse set of 100 challenging multiple-choice questions, handcrafted over a period of 6 months, covering the most popular and modern branches of data science and machine learning. These questions are challenging even for a typical Senior Machine Learning Engineer to answer correctly. To minimize the risk of data contamination, HardML uses mostly original content devised by the author. Current state of the art AI models achieve a 30% error rate on this benchmark, which is about 3 times larger than the one achieved on the equivalent, well known MMLU ML. While HardML is limited in scope and not aiming to push the frontier, primarily due to its multiple choice nature, it serves as a rigorous and modern testbed to quantify and track the progress of top AI. While plenty benchmarks and experimentation in LLM evaluation exist in other STEM fields like mathematics, physics and chemistry, the subfields of data science and machine learning remain fairly underexplored.

arxiv情報

著者 Tidor-Vlad Pricope
発行日 2025-05-06 15:53:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | HardML: A Benchmark For Evaluating Data Science And Machine Learning knowledge and reasoning in AI はコメントを受け付けていません

Binding threshold units with artificial oscillatory neurons

要約

人工岸本振動ニューロンは、しきい値ユニットの代替として最近導入されました。
経験的証拠は、振動ユニットが監視されていないオブジェクトの発見や特定の推論問題を含むいくつかのタスクでしきい値ユニットを上回ることを示唆しています。
これらの振動ニューロンの提案された結合メカニズムは不均一であり、一般化されたクラモト方程式としきい値単位に使用される標準的な結合方法を組み合わせています。
この研究ノートでは、振動ニューロンをしきい値単位と明確に区​​別し、それらの間に結合メカニズムを確立する理論的枠組みを提示します。
生物学的観点から、振動およびしきい値ユニットはニューラルコーディングの明確な側面を実現すると主張します:ほぼ、しきい値単位はニューロン発火のモデル強度であり、振動ユニットは周波数変調による情報交換を促進します。
これら2つのタイプのユニット間の相互作用を導き出すために、リアプノフ機能を認める動的システムに焦点を当てることにより、それらのダイナミクスを制約します。
しきい値ユニットの場合、これはホップフィールド連想メモリモデルにつながり、振動ユニットの場合、一般化されたkuramotoモデルの特定の形態が得られます。
結果として生じる動的システムは、自然に結合して、リアプノフ関数を認めるホップフィールドと黒本の連想メモリモデルを形成できます。
さまざまな形のカップリングが可能です。
特に、振動ニューロンを使用して、ホップフィールドネットワークの重量マトリックスに対する低ランク補正を実装できます。
この修正は、ヘビアン学習の形式として、または大規模な言語モデルの微調整に使用される一般的なLORAメソッドとして見ることができます。
私たちは、実例的な玩具実験を通じてこの特定の結合の実際的な実現を実証します。

要約(オリジナル)

Artificial Kuramoto oscillatory neurons were recently introduced as an alternative to threshold units. Empirical evidence suggests that oscillatory units outperform threshold units in several tasks including unsupervised object discovery and certain reasoning problems. The proposed coupling mechanism for these oscillatory neurons is heterogeneous, combining a generalized Kuramoto equation with standard coupling methods used for threshold units. In this research note, we present a theoretical framework that clearly distinguishes oscillatory neurons from threshold units and establishes a coupling mechanism between them. We argue that, from a biological standpoint, oscillatory and threshold units realise distinct aspects of neural coding: roughly, threshold units model intensity of neuron firing, while oscillatory units facilitate information exchange by frequency modulation. To derive interaction between these two types of units, we constrain their dynamics by focusing on dynamical systems that admit Lyapunov functions. For threshold units, this leads to Hopfield associative memory model, and for oscillatory units it yields a specific form of generalized Kuramoto model. The resulting dynamical systems can be naturally coupled to form a Hopfield-Kuramoto associative memory model, which also admits a Lyapunov function. Various forms of coupling are possible. Notably, oscillatory neurons can be employed to implement a low-rank correction to the weight matrix of a Hopfield network. This correction can be viewed either as a form of Hebbian learning or as a popular LoRA method used for fine-tuning of large language models. We demonstrate the practical realization of this particular coupling through illustrative toy experiments.

arxiv情報

著者 Vladimir Fanaskov,Ivan Oseledets
発行日 2025-05-06 15:54:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, q-bio.NC | Binding threshold units with artificial oscillatory neurons はコメントを受け付けていません

Counterfactual Inference for Eliminating Sentiment Bias in Recommender Systems

要約

推奨システム(RSS)は、ユーザーにパーソナライズされた推奨事項を提供することを目指しています。
センチメントバイアスとして知られる新たに発見されたバイアスは、レビューベースのRSS(RRSS)内の一般的な現象を明らかにします。ユーザーまたは否定的なレビューを持つアイテムの推奨精度は、肯定的なレビューを持つユーザーまたはアイテムと比較して悪化します。
重要なユーザーとニッチなアイテムは、このような不公平な推奨事項によって不利になります。
この問題を2つの段階で反事実的推論の観点から研究します。
モデルトレーニング段階で、因果グラフを構築し、最終評価スコアに感情がどのように影響するかをモデル化します。
推論段階では、直接的および間接効果を分離して、センチメントバイアスの影響を軽減し、反事実的推論を使用して間接効果を除去します。
広範な実験を実施し、結果は、より良い推奨事項と感情バイアスの効果的な緩和のために、モデルが評価予測で同等のパフォーマンスを達成できることを検証します。
私たちの知る限り、これはRSSのセンチメントバイアス緩和に反事実的な推論を採用する最初の作業です。

要約(オリジナル)

Recommender Systems (RSs) aim to provide personalized recommendations for users. A newly discovered bias, known as sentiment bias, uncovers a common phenomenon within Review-based RSs (RRSs): the recommendation accuracy of users or items with negative reviews deteriorates compared with users or items with positive reviews. Critical users and niche items are disadvantaged by such unfair recommendations. We study this problem from the perspective of counterfactual inference with two stages. At the model training stage, we build a causal graph and model how sentiment influences the final rating score. During the inference stage, we decouple the direct and indirect effects to mitigate the impact of sentiment bias and remove the indirect effect using counterfactual inference. We have conducted extensive experiments, and the results validate that our model can achieve comparable performance on rating prediction for better recommendations and effective mitigation of sentiment bias. To the best of our knowledge, this is the first work to employ counterfactual inference on sentiment bias mitigation in RSs.

arxiv情報

著者 Le Pan,Yuanjiang Cao,Chengkai Huang,Wenjie Zhang,Lina Yao
発行日 2025-05-06 16:00:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IR | Counterfactual Inference for Eliminating Sentiment Bias in Recommender Systems はコメントを受け付けていません

Learning Symbolic Persistent Macro-Actions for POMDP Solving Over Time

要約

このペーパーでは、マクロアクションとの不確実性の下で解釈可能な意思決定を達成するために、一時的な論理推論と部分的に観察可能なマルコフ決定プロセス(POMDP)の統合を提案します。
私たちの方法は、イベント計算(EC)に基づいて線形側頭論理(LTL)のフラグメントを活用して、\ emph {永続的}(つまり、一定)マクロ酸化を生成します。
このようなマクロ活動は、いくつかの実行(信念アクションペア)からの帰納的論理プログラミング(ILP)を介して学習されるため、手動で設計されたヒューリスティックの必要性を排除し、POMDP遷移モデルの仕様のみを必要とします。
Pocman and Rocksampleのベンチマークシナリオでは、学習したマクロアクションは、時間に依存しないヒューリスティックと比較すると表現力と一般性の増加を示し、実際に大幅な計算効率の改善を提供します。

要約(オリジナル)

This paper proposes an integration of temporal logical reasoning and Partially Observable Markov Decision Processes (POMDPs) to achieve interpretable decision-making under uncertainty with macro-actions. Our method leverages a fragment of Linear Temporal Logic (LTL) based on Event Calculus (EC) to generate \emph{persistent} (i.e., constant) macro-actions, which guide Monte Carlo Tree Search (MCTS)-based POMDP solvers over a time horizon, significantly reducing inference time while ensuring robust performance. Such macro-actions are learnt via Inductive Logic Programming (ILP) from a few traces of execution (belief-action pairs), thus eliminating the need for manually designed heuristics and requiring only the specification of the POMDP transition model. In the Pocman and Rocksample benchmark scenarios, our learned macro-actions demonstrate increased expressiveness and generality when compared to time-independent heuristics, indeed offering substantial computational efficiency improvements.

arxiv情報

著者 Celeste Veronese,Daniele Meli,Alessandro Farinelli
発行日 2025-05-06 16:08:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI | Learning Symbolic Persistent Macro-Actions for POMDP Solving Over Time はコメントを受け付けていません

Gap the (Theory of) Mind: Sharing Beliefs About Teammates’ Goals Boosts Collaboration Perception, Not Performance

要約

人員チームでは、計画、コラボレーション、および有効性を高めるために、目標を公然と共有することがしばしば想定されます。
ただし、これらの目標の直接的なコミュニケーションは必ずしも実行可能ではなく、チームメイトがアクションを通じてパートナーの意図を推測することを要求します。
これに基づいて、AIエージェントが人間のチームメイトの目標についての推測された理解を共有する能力が、タスクのパフォーマンスと知覚コラボレーションを改善できるかどうかを調査します。
3つの条件なしの認識(NR)、実行可能な目標(VG)、および実行可能な目標オンデマンド(VGOD)を比較することにより、目標共有情報はタスクパフォ​​ーマンスや全体的な満足度スコアの大幅な改善をもたらさないが、テーマ分析は戦略的適応とコラボレーションの主観的評価をサポートしたことを示唆していることがわかります。
認知負荷評価では、条件全体に追加の負担がなく、人間とエージェントの相互作用における情報性とシンプルさのバランスをとるという課題を強調しました。
これらの調査結果は、ゴールシェアリングの微妙なトレードオフを強調しています。信頼を促進し、認識されたコラボレーションを強化しますが、客観的なパフォーマンスの向上を妨げることがあります。

要約(オリジナル)

In human-agent teams, openly sharing goals is often assumed to enhance planning, collaboration, and effectiveness. However, direct communication of these goals is not always feasible, requiring teammates to infer their partner’s intentions through actions. Building on this, we investigate whether an AI agent’s ability to share its inferred understanding of a human teammate’s goals can improve task performance and perceived collaboration. Through an experiment comparing three conditions-no recognition (NR), viable goals (VG), and viable goals on-demand (VGod) – we find that while goal-sharing information did not yield significant improvements in task performance or overall satisfaction scores, thematic analysis suggests that it supported strategic adaptations and subjective perceptions of collaboration. Cognitive load assessments revealed no additional burden across conditions, highlighting the challenge of balancing informativeness and simplicity in human-agent interactions. These findings highlight the nuanced trade-off of goal-sharing: while it fosters trust and enhances perceived collaboration, it can occasionally hinder objective performance gains.

arxiv情報

著者 Yotam Amitai,Reuth Mirsky,Ofra Amir
発行日 2025-05-06 16:15:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI | Gap the (Theory of) Mind: Sharing Beliefs About Teammates’ Goals Boosts Collaboration Perception, Not Performance はコメントを受け付けていません