Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy

要約

多様なロボットデータセットでトレーニングされた最近のビジョン言語アクションモデルは、限られた領域内データを持つ有望な一般化機能を示しますが、コンパクトなアクションヘッドへの依存は、離散化または連続的なアクションが不均一なアクション空間への適応性を制約します。
統一されたマルチモーダル拡散プロセスを介して、変圧器アーキテクチャを活用して連続的なアクションシーケンスを直接除去するスケーラブルなフレームワークであるDITAを提示します。
DITAは、浅いネットワークを介して融合した埋め込みを除去する以前の方法から出発し、コンテキスト内の条件付けを採用します。歴史的観察からの除去されたアクションと生の視覚トークンとの間の細かい整列を可能にします。
この設計は、アクションデルタと環境ニュアンスを明示的にモデル化します。
Transformerのスケーラビリティとともに拡散アクション除去機をスケーリングすることにより、DITAは多様なカメラの視点、観察シーン、タスク、およびアクションスペースに横断的なデータセットを効果的に統合します。
このような相乗効果は、さまざまな分散に対する堅牢性を高め、長老タスクの実行の成功を促進します。
大規模なベンチマーク全体の評価は、シミュレーションにおける最先端または比較パフォーマンスを示しています。
特に、DITAは、サードパーソンカメラの入力のみを使用して、10ショットのFinetuningを通じて、環境変動と複雑な長距離タスクに対する堅牢な現実世界の適応を実現します。
このアーキテクチャは、ジェネラリストのロボット政策学習のための多目的で軽量でオープンソースのベースラインを確立しています。
プロジェクトページ:https://robodita.github.io。

要約(オリジナル)

While recent vision-language-action models trained on diverse robot datasets exhibit promising generalization capabilities with limited in-domain data, their reliance on compact action heads to predict discretized or continuous actions constrains adaptability to heterogeneous action spaces. We present Dita, a scalable framework that leverages Transformer architectures to directly denoise continuous action sequences through a unified multimodal diffusion process. Departing from prior methods that condition denoising on fused embeddings via shallow networks, Dita employs in-context conditioning — enabling fine-grained alignment between denoised actions and raw visual tokens from historical observations. This design explicitly models action deltas and environmental nuances. By scaling the diffusion action denoiser alongside the Transformer’s scalability, Dita effectively integrates cross-embodiment datasets across diverse camera perspectives, observation scenes, tasks, and action spaces. Such synergy enhances robustness against various variances and facilitates the successful execution of long-horizon tasks. Evaluations across extensive benchmarks demonstrate state-of-the-art or comparative performance in simulation. Notably, Dita achieves robust real-world adaptation to environmental variances and complex long-horizon tasks through 10-shot finetuning, using only third-person camera inputs. The architecture establishes a versatile, lightweight and open-source baseline for generalist robot policy learning. Project Page: https://robodita.github.io.

arxiv情報

著者 Zhi Hou,Tianyi Zhang,Yuwen Xiong,Haonan Duan,Hengjun Pu,Ronglei Tong,Chengyang Zhao,Xizhou Zhu,Yu Qiao,Jifeng Dai,Yuntao Chen
発行日 2025-03-25 15:19:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy はコメントを受け付けていません

OpenLex3D: A New Evaluation Benchmark for Open-Vocabulary 3D Scene Representations

要約

3Dシーンの理解は、自然言語を介した相互作用を可能にするオープンボキャブラリー言語モデルによって変換されました。
ただし、これらの表現の評価は、言語の豊かさを捉えていないクローズドセットセマンティクスに限定されています。
この作業では、3Dオープンボキャブラリーシーンの表現を評価するための専用のベンチマークであるOpenLEX3Dを提示します。
OpenLEX3Dは、同義オブジェクトカテゴリと追加の微妙な説明を導入することにより、実際の言語の変動性をキャプチャするReplica、Scannet ++、およびHM3Dの23シーンのまったく新しいラベルアノテーションを提供します。
オープンセットの3Dセマンティックセグメンテーションタスクとオブジェクト検索タスクを導入することにより、機能の精度、セグメンテーション、およびダウンストリーム機能に関する洞察を提供します。
OpenLEX3Dで既存のさまざまな3Dオープンボキャブラリーメソッドを評価し、故障ケースを紹介し、改善の手段を評価します。
ベンチマークは、https://openlex3d.github.io/で公開されています。

要約(オリジナル)

3D scene understanding has been transformed by open-vocabulary language models that enable interaction via natural language. However, the evaluation of these representations is limited to closed-set semantics that do not capture the richness of language. This work presents OpenLex3D, a dedicated benchmark to evaluate 3D open-vocabulary scene representations. OpenLex3D provides entirely new label annotations for 23 scenes from Replica, ScanNet++, and HM3D, which capture real-world linguistic variability by introducing synonymical object categories and additional nuanced descriptions. By introducing an open-set 3D semantic segmentation task and an object retrieval task, we provide insights on feature precision, segmentation, and downstream capabilities. We evaluate various existing 3D open-vocabulary methods on OpenLex3D, showcasing failure cases, and avenues for improvement. The benchmark is publicly available at: https://openlex3d.github.io/.

arxiv情報

著者 Christina Kassab,Sacha Morin,Martin Büchner,Matías Mattamala,Kumaraditya Gupta,Abhinav Valada,Liam Paull,Maurice Fallon
発行日 2025-03-25 15:28:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | OpenLex3D: A New Evaluation Benchmark for Open-Vocabulary 3D Scene Representations はコメントを受け付けていません

A Multi-Agent Framework Integrating Large Language Models and Generative AI for Accelerated Metamaterial Design

要約

卓越した機械的、電磁特性、熱特性で有名なメタマテリアルは、多様なアプリケーション全体で変革の可能性を保持しますが、その設計は労働集約的な試行錯誤の方法と限られたデータの相互運用性によって制約されたままです。
ここでは、大規模な言語モデルを最先端の生成AIと相乗的に統合してメタマテリアルデザインに革命をもたらす新しいマルチエージェントフレームワークであるCrossmatagentを紹介します。
エージェントの階層的なチームを調整することにより – パターン分析、建築統合、迅速なエンジニアリング、監督フィードバックなどのタスクに特化している – 私たちシステムは、Dall-E 3の生成精度と微調整された安定拡散XLモデルの生成精度とともにGPT-4oのマルチモーダル推論を活用します。
この統合アプローチは、データの増強を自動化し、設計の忠実度を高め、シミュレーションと3Dの印刷対応のメタマテリアルパターンを生成します。
さまざまな負荷条件下でのクリップベースのアライメント、SHAP解釈可能性分析、および機械的シミュレーションなどの包括的な評価は、多様で再現可能な、アプリケーション対応のデザインを生成するフレームワークの能力を示しています。
したがって、クロスマタゲントは、概念的な革新と実際の実現のギャップを埋めるスケーラブルでAI駆動型のパラダイムを確立し、加速されたメタマテリアル発達の方法を開きます。

要約(オリジナル)

Metamaterials, renowned for their exceptional mechanical, electromagnetic, and thermal properties, hold transformative potential across diverse applications, yet their design remains constrained by labor-intensive trial-and-error methods and limited data interoperability. Here, we introduce CrossMatAgent–a novel multi-agent framework that synergistically integrates large language models with state-of-the-art generative AI to revolutionize metamaterial design. By orchestrating a hierarchical team of agents–each specializing in tasks such as pattern analysis, architectural synthesis, prompt engineering, and supervisory feedback–our system leverages the multimodal reasoning of GPT-4o alongside the generative precision of DALL-E 3 and a fine-tuned Stable Diffusion XL model. This integrated approach automates data augmentation, enhances design fidelity, and produces simulation- and 3D printing-ready metamaterial patterns. Comprehensive evaluations, including CLIP-based alignment, SHAP interpretability analyses, and mechanical simulations under varied load conditions, demonstrate the framework’s ability to generate diverse, reproducible, and application-ready designs. CrossMatAgent thus establishes a scalable, AI-driven paradigm that bridges the gap between conceptual innovation and practical realization, paving the way for accelerated metamaterial development.

arxiv情報

著者 Jie Tian,Martin Taylor Sobczak,Dhanush Patil,Jixin Hou,Lin Pang,Arunachalam Ramanathan,Libin Yang,Xianyan Chen,Yuval Golan,Hongyue Sun,Kenan Song,Xianqiao Wang
発行日 2025-03-25 17:53:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.mtrl-sci, cs.RO | A Multi-Agent Framework Integrating Large Language Models and Generative AI for Accelerated Metamaterial Design はコメントを受け付けていません

Kernel Learning Assisted Synthesis Condition Exploration for Ternary Spinel

要約

機械学習とハイスループットの実験により、組成の柔軟性を活用することにより、混合金属酸化物触媒の発見が大幅に加速されました。
ただし、固体材料の確立された合成ルートの欠如は、無機化学における重要な課題のままです。
したがって、解釈可能な機械学習モデルは、位相形成を管理する重要な要因に関する洞察を提供するため、不可欠です。
ここでは、単相Fe $ _2 $(ZNCO)o $ _4 $の形成に焦点を当て、ハイスループットの共沈着法を介して合成されます。
カーネル分類モデルとグローバルSHAP分析の新しいアプリケーションを組み合わせて、各機能の貢献を解釈することにより、単相合成能力にとって最も重要な実験機能を特定しました。
グローバルなSHAP分析により、単相スピネル形成への前駆体および沈殿剤の寄与が確立された結晶成長理論と密接に整合することが明らかになりました。
これらの結果は、精製合成プロトコルにおける解釈可能な機械学習の重要性を強調するだけでなく、無機合成におけるデータに基づいた実験設計のフレームワークを確立します。

要約(オリジナル)

Machine learning and high-throughput experimentation have greatly accelerated the discovery of mixed metal oxide catalysts by leveraging their compositional flexibility. However, the lack of established synthesis routes for solid-state materials remains a significant challenge in inorganic chemistry. An interpretable machine learning model is therefore essential, as it provides insights into the key factors governing phase formation. Here, we focus on the formation of single-phase Fe$_2$(ZnCo)O$_4$, synthesized via a high-throughput co-precipitation method. We combined a kernel classification model with a novel application of global SHAP analysis to pinpoint the experimental features most critical to single phase synthesizability by interpreting the contributions of each feature. Global SHAP analysis reveals that precursor and precipitating agent contributions to single-phase spinel formation align closely with established crystal growth theories. These results not only underscore the importance of interpretable machine learning in refining synthesis protocols but also establish a framework for data-informed experimental design in inorganic synthesis.

arxiv情報

著者 Yutong Liu,Mehrad Ansari,Robert Black,Jason Hattrick-Simpers
発行日 2025-03-25 13:28:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.mtrl-sci, cs.LG, physics.chem-ph | Kernel Learning Assisted Synthesis Condition Exploration for Ternary Spinel はコメントを受け付けていません

An Efficient Data Reuse with Tile-Based Adaptive Stationary for Transformer Accelerators

要約

変圧器ベースのモデルは、コンピュータービジョンや自然言語処理など、多くの分野で\ textit {de facto}バックボーンになりました。
ただし、これらのモデルがサイズが拡張されるため、内部計算と比較してエネルギー消費量が大幅に高いため、外部メモリアクセス(EMA)と活性化は重要なボトルネックになります。
ほとんどの以前の作業は自己関節メカニズムの最適化に焦点を当てていますが、EMAコストも同様に重要な線形投影中にデータ転送を最適化することにはほとんど注意が払われていません。
このホワイトペーパーでは、入力シーケンスの長さに基づいて、タイルの粒度で固定的な入力または重量を選択するタイルベースの適応固定(TAS)スキームを提案します。
私たちの実験結果は、TASが従来の固定スキームと比較してEMAを97%以上減らすことができ、さまざまな注意最適化技術とハードウェアアクセラレータと互換性があることを示しています。

要約(オリジナル)

Transformer-based models have become the \textit{de facto} backbone across many fields, such as computer vision and natural language processing. However, as these models scale in size, external memory access (EMA) for weight and activations becomes a critical bottleneck due to its significantly higher energy consumption compared to internal computations. While most prior work has focused on optimizing the self-attention mechanism, little attention has been given to optimizing data transfer during linear projections, where EMA costs are equally important. In this paper, we propose the Tile-based Adaptive Stationary (TAS) scheme that selects the input or weight stationary in a tile granularity, based on the input sequence length. Our experimental results demonstrate that TAS can significantly reduce EMA by more than 97\% compared to traditional stationary schemes, while being compatible with various attention optimization techniques and hardware accelerators.

arxiv情報

著者 Tseng-Jen Li,Tian-Sheuan Chang
発行日 2025-03-25 13:29:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AR, cs.LG | An Efficient Data Reuse with Tile-Based Adaptive Stationary for Transformer Accelerators はコメントを受け付けていません

A Quantum Neural Network Transfer-Learning Model for Forecasting Problems with Continuous and Discrete Variables

要約

この研究では、予測タスクの転送学習アプローチとして、シンプルでありながら効果的な連続的および離散的に変数の量子ニューラルネットワーク(QNN)モデルを紹介します。
CV-QNNは、エンタングルメントを確立するための2つのキュービットを備えた単一量子層を備えており、変位、回転、ビームスプリッター、絞り、および非ガウスの立方相を含む最小限の量子ゲートを利用し、最大8つのトレーニング可能なパラメーターを備えています。
このモデルの重要な利点は、単一のデータセットでトレーニングすることができることです。その後、学習したパラメーターを、細かくない場合、他の予測問題に転送できます。
最初にクルディスタンの負荷需要データセットで訓練されたモデルの凍結パラメーターは、エネルギー消費、交通の流れ、気象条件、暗号通貨の価格予測など、さまざまな予測タスクに正常に適用され、パフォーマンスが強いことが示されています。
さらに、この研究では、同等の2線と4線の構成を備えた離散性変数量子モデルを導入し、パフォーマンス評価を提示し、連続した変数モデルと比較して良好ではあるが比較的低い有効性を示しています。

要約(オリジナル)

This study introduces simple yet effective continuous- and discrete-variable quantum neural network (QNN) models as a transfer-learning approach for forecasting tasks. The CV-QNN features a single quantum layer with two qubits to establish entanglement and utilizes a minimal set of quantum gates, including displacement, rotation, beam splitter, squeezing, and a non-Gaussian cubic-phase gate, with a maximum of eight trainable parameters. A key advantage of this model is its ability to be trained on a single dataset, after which the learned parameters can be transferred to other forecasting problems with little to no fine-tuning. Initially trained on the Kurdistan load demand dataset, the model’s frozen parameters are successfully applied to various forecasting tasks, including energy consumption, traffic flow, weather conditions, and cryptocurrency price prediction, demonstrating strong performance. Furthermore, the study introduces a discrete-variable quantum model with an equivalent 2- and 4-wire configuration and presents a performance assessment, showing good but relatively lower effectiveness compared to the continuous-variable model.

arxiv情報

著者 Ismael Abdulrahman
発行日 2025-03-25 13:35:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SY, eess.SY, quant-ph | A Quantum Neural Network Transfer-Learning Model for Forecasting Problems with Continuous and Discrete Variables はコメントを受け付けていません

Enhancing Graphical Lasso: A Robust Scheme for Non-Stationary Mean Data

要約

この作業は、時変の平均でガウスグラフィカルモデル(GGM)に従ってデータから学習するグラフの問題に対処します。
まばらな精密行列を推定するための標準的な方法であるグラフィカルラッソ(GL)は、観測されたデータがゼロ平均ガウス分布に従うことを前提としています。
ただし、この仮定は、外部の影響、傾向、または体制の変化のために平均が時間とともに進化する現実世界のシナリオでしばしば違反されます。
平均が適切に考慮されていない場合、GLを直接適用すると、偏った精度マトリックスの推定につながる可能性があるため、グラフ学習タスクが妨げられます。
この制限を克服するために、適応ターゲットを絞った適応性の重要性サンプリング(GL-ATAIS)を備えたグラフィカルなラッソを提案します。これは、時変平均と精密マトリックスを共同で推定する反復方法です。
私たちのアプローチは、ベイジアンの推論を頻繁な推定と統合し、重要度サンプリングを活用して平均の推定値を取得しながら、正規化された最尤推定器を使用して精密行列を推測します。
両方の推定値を繰り返し精製することにより、GL-Ataisは、時代の平均によって導入されるバイアスを軽減し、より正確なグラフの回復につながります。
私たちの数値評価は、時間依存の手段を適切に説明することの影響を示し、真のグラフ構造の回復における標準GLに対するGL-Ataisの利点を強調します。

要約(オリジナル)

This work addresses the problem of graph learning from data following a Gaussian Graphical Model (GGM) with a time-varying mean. Graphical Lasso (GL), the standard method for estimating sparse precision matrices, assumes that the observed data follows a zero-mean Gaussian distribution. However, this assumption is often violated in real-world scenarios where the mean evolves over time due to external influences, trends, or regime shifts. When the mean is not properly accounted for, applying GL directly can lead to estimating a biased precision matrix, hence hindering the graph learning task. To overcome this limitation, we propose Graphical Lasso with Adaptive Targeted Adaptive Importance Sampling (GL-ATAIS), an iterative method that jointly estimates the time-varying mean and the precision matrix. Our approach integrates Bayesian inference with frequentist estimation, leveraging importance sampling to obtain an estimate of the mean while using a regularized maximum likelihood estimator to infer the precision matrix. By iteratively refining both estimates, GL-ATAIS mitigates the bias introduced by time-varying means, leading to more accurate graph recovery. Our numerical evaluation demonstrates the impact of properly accounting for time-dependent means and highlights the advantages of GL-ATAIS over standard GL in recovering the true graph structure.

arxiv情報

著者 Samuel Rey,Ernesto Curbelo,Luca Martino,Fernando Llorente,Antonio G. Marques
発行日 2025-03-25 13:40:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Enhancing Graphical Lasso: A Robust Scheme for Non-Stationary Mean Data はコメントを受け付けていません

Towards Efficient Training of Graph Neural Networks: A Multiscale Approach

要約

グラフニューラルネットワーク(GNNS)は、グラフ構造のデータから学習および推測するための強力なツールとして浮上しており、多くの場合、大量のデータと大きなグラフを考慮して、さまざまなアプリケーションで広く使用されています。
ただし、このようなデータのトレーニングには、大きなメモリと広範な計算が必要です。
この論文では、グラフのマルチスケール表現全体に情報を統合するように設計されたGNNSの効率的なマルチスケールトレーニングのための新しいフレームワークを紹介します。
私たちのアプローチは、階層的なグラフ表現を活用し、各粗いスケールグラフのノードとエッジが少ないトレーニングプロセスで粗いグラフスケールを活用します。
このアプローチに基づいて、粗から財政、サブからフル、マルチスケールグラデーションの計算など、一連のGNNトレーニング方法を提案します。
さまざまなデータセットや学習タスクに対するメソッドの有効性を実証します。

要約(オリジナル)

Graph Neural Networks (GNNs) have emerged as a powerful tool for learning and inferring from graph-structured data, and are widely used in a variety of applications, often considering large amounts of data and large graphs. However, training on such data requires large memory and extensive computations. In this paper, we introduce a novel framework for efficient multiscale training of GNNs, designed to integrate information across multiscale representations of a graph. Our approach leverages a hierarchical graph representation, taking advantage of coarse graph scales in the training process, where each coarse scale graph has fewer nodes and edges. Based on this approach, we propose a suite of GNN training methods: such as coarse-to-fine, sub-to-full, and multiscale gradient computation. We demonstrate the effectiveness of our methods on various datasets and learning tasks.

arxiv情報

著者 Eshed Gal,Moshe Eliasof,Carola-Bibiane Schönlieb,Eldad Haber,Eran Treister
発行日 2025-03-25 13:52:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Towards Efficient Training of Graph Neural Networks: A Multiscale Approach はコメントを受け付けていません

Communities in the Kuramoto Model: Dynamics and Detection via Path Signatures

要約

多変量動的プロセスの動作は、システムのコンポーネントを関連付ける基礎となる構造接続によって支配されることがよくあります。
たとえば、時系列を介してしばしば測定される脳の活動は、基礎となる構造グラフによって決定されます。ノードはニューロンまたは脳領域を表し、エッジは皮質のつながりを表します。
相関ベースやスペクトル技術などの観測されたダイナミクスから構造的接続を推測するための既存の方法は、解釈可能な方法で高次元の時系列で複雑な関係を完全にキャプチャできない可能性があります。
ここでは、この問題に対処するために連続パスの幾何学的および時間的特性をコードする数学的なフレームワークであるパスシグネチャの使用を提案します。
パスシグネチャは、動的データのレパラメーター化不変の特性評価を提供し、特に、リードラグ現象を明らかにするリードマトリックスを計算するために使用できます。
確率的ブロックモデルグラフで定義されたKuramoto Stochastic Block Model(KSBM)と呼ばれるKuramotoモデルの結合発振器からの時系列へのアプローチを紹介します。
平均フィールド理論とガウス近似を使用して、さまざまな時間体制におけるKSBMダイナミクスの還元モデルを分析的に導き出し、これらの設定のリードマトリックスを理論的に特徴付けます。
これらの洞察を活用して、新しいシグネチャーベースのコミュニティ検出アルゴリズムを提案し、複数のKSBMインスタンスで観察された時系列から構造コミュニティの正確な回復を達成します。
我々の結果は、パスシグネチャが複雑な神経データや他の高次元システムの分析に関する新しい視点を提供し、一時的な機能関係を明示的に活用して基礎となる構造を推測することを示しています。

要約(オリジナル)

The behavior of multivariate dynamical processes is often governed by underlying structural connections that relate the components of the system. For example, brain activity which is often measured via time series is determined by an underlying structural graph, where nodes represent neurons or brain regions and edges represent cortical connectivity. Existing methods for inferring structural connections from observed dynamics, such as correlation-based or spectral techniques, may fail to fully capture complex relationships in high-dimensional time series in an interpretable way. Here, we propose the use of path signatures a mathematical framework that encodes geometric and temporal properties of continuous paths to address this problem. Path signatures provide a reparametrization-invariant characterization of dynamical data and, in particular, can be used to compute the lead matrix which reveals lead-lag phenomena. We showcase our approach on time series from coupled oscillators in the Kuramoto model defined on a stochastic block model graph, termed the Kuramoto stochastic block model (KSBM). Using mean-field theory and Gaussian approximations, we analytically derive reduced models of KSBM dynamics in different temporal regimes and theoretically characterize the lead matrix in these settings. Leveraging these insights, we propose a novel signature-based community detection algorithm, achieving exact recovery of structural communities from observed time series in multiple KSBM instances. Our results demonstrate that path signatures provide a novel perspective on analyzing complex neural data and other high-dimensional systems, explicitly exploiting temporal functional relationships to infer underlying structure.

arxiv情報

著者 Tâm Johan Nguyên,Darrick Lee,Bernadette Jana Stolz
発行日 2025-03-25 14:02:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.dis-nn, cs.LG, nlin.AO, q-bio.NC, q-bio.QM, stat.ML | Communities in the Kuramoto Model: Dynamics and Detection via Path Signatures はコメントを受け付けていません

Geometric Preference Elicitation for Minimax Regret Optimization in Uncertainty Matroids

要約

このペーパーでは、正確な重量情報が利用できないが、可能な重量値に関する洞察にアクセス可能な不確実なMatroid最適化のための効率的な選好誘発フレームワークを提示します。
私たちのアプローチの中心的な革新は、ユーザーの好みを体系的に引き出す能力にあり、最適化プロセスを意思決定者の目標とより密接に合わせています。
要素のペア間の好みを徐々に照会することにより、マトロイドの構造特性を活用して、パラメトリックの不確実性領域を繰り返し改善します。
私たちの方法は、いくつかの誘発ラウンドで後悔を減らすことにより、正確な最適を達成することを目的としています。
さらに、私たちのアプローチは、以前の方法とは異なり、すべての反復でのMinimax後悔の計算と線形プログラミングソルバーの使用を回避します。
4つの標準Matroidの実験結果は、既存の手法よりも優先順位のクエリが少なく、この方法が最適性に到達することを示しています。

要約(オリジナル)

This paper presents an efficient preference elicitation framework for uncertain matroid optimization, where precise weight information is unavailable, but insights into possible weight values are accessible. The core innovation of our approach lies in its ability to systematically elicit user preferences, aligning the optimization process more closely with decision-makers’ objectives. By incrementally querying preferences between pairs of elements, we iteratively refine the parametric uncertainty regions, leveraging the structural properties of matroids. Our method aims to achieve the exact optimum by reducing regret with a few elicitation rounds. Additionally, our approach avoids the computation of Minimax Regret and the use of Linear programming solvers at every iteration, unlike previous methods. Experimental results on four standard matroids demonstrate that our method reaches optimality more quickly and with fewer preference queries than existing techniques.

arxiv情報

著者 Aditya Sai Ellendula,Arun K Pujari,Vikas Kumar,Venkateswara Rao Kagita
発行日 2025-03-25 14:12:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Geometric Preference Elicitation for Minimax Regret Optimization in Uncertainty Matroids はコメントを受け付けていません