Hybrid Voting-Based Task Assignment in Modular Construction Scenarios

要約

オフサイトのプレハブとオンサイトアセンブリを含むモジュラー構造は、重要な利点を提供しますが、ロボットオートメーションに複雑な調整の課題を提示します。
これらの構造化された環境でマルチエージェントシステム(MAS)を活用するには、効果的なタスク割り当てが重要です。
このペーパーでは、不均一なマルチエージェント建設チーム間のコラボレーションを最適化するための斬新なアプローチであるハイブリッド投票ベースのタスク割り当て(HVBTA)フレームワークを紹介します。
HVBTAは、タスク代表団の人間の推論に触発され、エージェント機能とタスク要件の間の微妙な適合性評価のために、複数の投票メカニズムを大規模な言語モデル(LLM)の機能と独自に統合します。
フレームワークは、エージェントに機能プロファイルを割り当て、構造タスクにタスク説明と呼ばれる詳細な要件リストを割り当て、その後定量的適合性マトリックスを生成することにより動作します。
事前に訓練されたLLMによって増強された6つの異なる投票方法は、このマトリックスを分析して、各タスクの最適なエージェントを堅牢に識別します。
紛争ベースの検索(CBS)は、分散型の衝突のないパス計画のために統合され、組み立て業務中にロボットチームの効率的かつ安全な空間的調整を確保します。
HVBTAは、効率的で競合のない割り当てと調整を可能にし、潜在的に高速でより正確なモジュラーアセンブリを促進します。
現在の作業は、多様なロボットプラットフォームとタスクの複雑さを含むさまざまなシミュレートされた構造シナリオにおけるHVBTAのパフォーマンスを評価しています。
明確に定義可能なタスクと機能を備えたドメインの一般化可能なフレームワークとして設計されていますが、HVBTAは、所定の建設計画により、モジュラー構造におけるマルチエージェント共同ロボット工学の厳しい調整要件に対処するために特に効果的です。

要約(オリジナル)

Modular construction, involving off-site prefabrication and on-site assembly, offers significant advantages but presents complex coordination challenges for robotic automation. Effective task allocation is critical for leveraging multi-agent systems (MAS) in these structured environments. This paper introduces the Hybrid Voting-Based Task Assignment (HVBTA) framework, a novel approach to optimizing collaboration between heterogeneous multi-agent construction teams. Inspired by human reasoning in task delegation, HVBTA uniquely integrates multiple voting mechanisms with the capabilities of a Large Language Model (LLM) for nuanced suitability assessment between agent capabilities and task requirements. The framework operates by assigning Capability Profiles to agents and detailed requirement lists called Task Descriptions to construction tasks, subsequently generating a quantitative Suitability Matrix. Six distinct voting methods, augmented by a pre-trained LLM, analyze this matrix to robustly identify the optimal agent for each task. Conflict-Based Search (CBS) is integrated for decentralized, collision-free path planning, ensuring efficient and safe spatio-temporal coordination of the robotic team during assembly operations. HVBTA enables efficient, conflict-free assignment and coordination, facilitating potentially faster and more accurate modular assembly. Current work is evaluating HVBTA’s performance across various simulated construction scenarios involving diverse robotic platforms and task complexities. While designed as a generalizable framework for any domain with clearly definable tasks and capabilities, HVBTA will be particularly effective for addressing the demanding coordination requirements of multi-agent collaborative robotics in modular construction due to the predetermined construction planning involved.

arxiv情報

著者 Daniel Weiner,Raj Korpan
発行日 2025-05-19 16:01:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Hybrid Voting-Based Task Assignment in Modular Construction Scenarios はコメントを受け付けていません

Scalable Importance Sampling in High Dimensions with Low-Rank Mixture Proposals

要約

重要性サンプリングは、サンプリング分布をまれな関心のあるイベントに偏らせることにより、まれなイベントの可能性を効率的に推定するためのモンテカルロ技術です。
学んだ提案分布から加重サンプルを描画することにより、重要なサンプリングにより、まれなイベントまたは分布の尾のよりサンプル効率の高い推定が可能になります。
提案密度の一般的な選択は、ガウス混合モデル(GMM)です。
ただし、高次元でフルランクのGMM共分散行列を推定することは、数値の不安定性のために困難な作業です。
この作業では、重要性サンプリング方法のパラメトリック提案密度として、確率的主成分アナライザー(MPPCA)の混合物を使用することを提案します。
MPPCAモデルは、高次元空間であっても、期待最大化を使用して迅速に適合できる低ランク混合モデルの一種です。
3つのシミュレートされたシステムでの方法を検証し、サンプルの効率と故障分布の特性化の質の一貫した利益を示します。

要約(オリジナル)

Importance sampling is a Monte Carlo technique for efficiently estimating the likelihood of rare events by biasing the sampling distribution towards the rare event of interest. By drawing weighted samples from a learned proposal distribution, importance sampling allows for more sample-efficient estimation of rare events or tails of distributions. A common choice of proposal density is a Gaussian mixture model (GMM). However, estimating full-rank GMM covariance matrices in high dimensions is a challenging task due to numerical instabilities. In this work, we propose using mixtures of probabilistic principal component analyzers (MPPCA) as the parametric proposal density for importance sampling methods. MPPCA models are a type of low-rank mixture model that can be fit quickly using expectation-maximization, even in high-dimensional spaces. We validate our method on three simulated systems, demonstrating consistent gains in sample efficiency and quality of failure distribution characterization.

arxiv情報

著者 Liam A. Kruse,Marc R. Schlichting,Mykel J. Kochenderfer
発行日 2025-05-19 16:44:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, stat.ML | Scalable Importance Sampling in High Dimensions with Low-Rank Mixture Proposals はコメントを受け付けていません

Approximating Global Contact-Implicit MPC via Sampling and Local Complementarity

要約

汎用の器用な操作を実現するには、ロボットは連絡先が豊富な動作を迅速に考案して実行する必要があります。
既存のモデルベースのコントローラーは、可能な連絡先シーケンスの指数関数的な数にわたってリアルタイムでグローバルに最適化することができません。
代わりに、接触指示制御の最近の進捗状況により、ハイブリッドではあるが、ローカル近似を行うよりシンプルなモデルが活用されています。
ただし、ローカルモデルを使用すると、コントローラーが近くの相互作用のみを活用するようにコントローラーを本質的に制限し、可能性のある接触のスペースを豊かに探索するために介入を必要とする可能性があります。
局所的な相補性ベースの制御の強さを、低次元の、しかしグローバルなサンプリングと組み合わせて、可能なエンドエフェクターの位置を組み合わせた新しいアプローチを提示します。
私たちの重要な洞察は、すべてのコントロールループでの接触が豊富な段階に先行する接触のないステージを考慮することです。
私たちのアルゴリズムは、並行して、コンタクトフリーステージがロボットを移動できるエフェクターの位置をサンプルし、サンプリングされた各場所にローカルに存在する接点MPCによって予測されるコストを考慮します。
その結果、リアルタイムの器用な操作が可能なグローバルに基づいた接触不可解なコントローラーができます。
フランカパンダアームを使用して、非凸オブジェクトの正確で非充実した操作についてコントローラーを実証します。
プロジェクトページ:https://approximating-global-ci-mpc.github.io

要約(オリジナル)

To achieve general-purpose dexterous manipulation, robots must rapidly devise and execute contact-rich behaviors. Existing model-based controllers are incapable of globally optimizing in real-time over the exponential number of possible contact sequences. Instead, recent progress in contact-implicit control has leveraged simpler models that, while still hybrid, make local approximations. However, the use of local models inherently limits the controller to only exploit nearby interactions, potentially requiring intervention to richly explore the space of possible contacts. We present a novel approach which leverages the strengths of local complementarity-based control in combination with low-dimensional, but global, sampling of possible end-effector locations. Our key insight is to consider a contact-free stage preceding a contact-rich stage at every control loop. Our algorithm, in parallel, samples end effector locations to which the contact-free stage can move the robot, then considers the cost predicted by contact-rich MPC local to each sampled location. The result is a globally-informed, contact-implicit controller capable of real-time dexterous manipulation. We demonstrate our controller on precise, non-prehensile manipulation of non-convex objects using a Franka Panda arm. Project page: https://approximating-global-ci-mpc.github.io

arxiv情報

著者 Sharanya Venkatesh,Bibit Bianchini,Alp Aydinoglu,William Yang,Michael Posa
発行日 2025-05-19 16:52:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Approximating Global Contact-Implicit MPC via Sampling and Local Complementarity はコメントを受け付けていません

Seeing, Saying, Solving: An LLM-to-TL Framework for Cooperative Robots

要約

倉庫などのロボット展開の増加は、予期せぬ紛争を解決するために、異種のロボットチーム間のシームレスなコラボレーションの必要性を明らかにしました。
この課題に対処するために、ロボットが要求してヘルプを提供するための斬新な分散型フレームワークを提案します。
フレームワークは、Vision言語モデル(VLM)を使用して競合を検出し、ヘルプが必要かどうかを推論することから始まります。
もしそうなら、それは大規模な言語モデル(LLM)を使用して、自然言語(NL)ヘルプのリクエストを作成して放送します。
潜在的なヘルパーロボットは、リクエストに対する推論とヘルプを提供し、現在のタスクへの影響に関する情報を提供します。
ヘルパーの推論は、バックスノーフォーム(BNF)文法を使用して信号時間論理(STL)に基づいたLLMを介して実装され、構文的に有効なNL-STL翻訳を保証します。これは、混合整数線形プログラム(MILP)として解決されます。
最後に、Requester Robotは、システム全体への影響を推論することにより、ヘルパーを選択します。
ヘルパーを選択するためのさまざまな戦略を考慮した実験を介してシステムを評価し、要求者ロボットが複数のヘルプオファーと単純なヒューリスティックを考慮することにより、システムへの全体的な時間の影響を最小限に抑えることができることを発見します(たとえば、最寄りのロボットを選択するために選択します)。

要約(オリジナル)

Increased robot deployment, such as in warehousing, has revealed a need for seamless collaboration among heterogeneous robot teams to resolve unforeseen conflicts. To address this challenge, we propose a novel, decentralized framework for robots to request and provide help. The framework begins with robots detecting conflicts using a Vision Language Model (VLM), then reasoning over whether help is needed. If so, it crafts and broadcasts a natural language (NL) help request using a Large Language Model (LLM). Potential helper robots reason over the request and offer help (if able), along with information about impact to their current tasks. Helper reasoning is implemented via an LLM grounded in Signal Temporal Logic (STL) using a Backus-Naur Form (BNF) grammar to guarantee syntactically valid NL-to-STL translations, which are then solved as a Mixed Integer Linear Program (MILP). Finally, the requester robot chooses a helper by reasoning over impact on the overall system. We evaluate our system via experiments considering different strategies for choosing a helper, and find that a requester robot can minimize overall time impact on the system by considering multiple help offers versus simple heuristics (e.g., selecting the nearest robot to help).

arxiv情報

著者 Dan BW Choe,Sundhar Vinodh Sangeetha,Steven Emanuel,Chih-Yuan Chiu,Samuel Coogan,Shreyas Kousik
発行日 2025-05-19 17:19:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Seeing, Saying, Solving: An LLM-to-TL Framework for Cooperative Robots はコメントを受け付けていません

A Practical Guide for Incorporating Symmetry in Diffusion Policy

要約

最近、政策学習のための同等のニューラルネットワークは、サンプルの効率と一般化の有望な改善を示していますが、それらの幅広い採用は、実装の複雑さのために大きな障壁に直面しています。
等量のアーキテクチャには通常、特殊な数学的定式化とカスタムネットワーク設計が必要であり、拡散ベースのモデルなどの最新のポリシーフレームワークと統合する際に大きな課題を提起します。
このホワイトペーパーでは、完全な等量設計のオーバーヘッドなしに対称性の利点を拡散ポリシーに組み込むための多くの簡単かつ実用的なアプローチを探ります。
具体的には、(i)相対的な軌跡アクションと目の握手の知覚を介した不変表現、(ii)等式のビジョンエンコーダーの統合、および(iii)フレーム平均化を使用した前提条件のエンコーダーとの対称特徴抽出を調査します。
まず、目の中での知覚と相対的またはデルタのアクションパラメーター化を組み合わせることで、固有のSE(3)不変性が得られ、したがって政策の一般化が改善されることを証明します。
次に、拡散ポリシーに対称性を統合するためのこれらの設計選択に関する系統的な実験的研究を実施し、等しい特徴抽出を伴う不変表現がポリシーのパフォーマンスを大幅に改善すると結論付けます。
私たちの方法は、実装を大幅に簡素化しながら、完全に等しいアーキテクチャと同等またはそれを超えるパフォーマンスを達成します。

要約(オリジナル)

Recently, equivariant neural networks for policy learning have shown promising improvements in sample efficiency and generalization, however, their wide adoption faces substantial barriers due to implementation complexity. Equivariant architectures typically require specialized mathematical formulations and custom network design, posing significant challenges when integrating with modern policy frameworks like diffusion-based models. In this paper, we explore a number of straightforward and practical approaches to incorporate symmetry benefits into diffusion policies without the overhead of full equivariant designs. Specifically, we investigate (i) invariant representations via relative trajectory actions and eye-in-hand perception, (ii) integrating equivariant vision encoders, and (iii) symmetric feature extraction with pretrained encoders using Frame Averaging. We first prove that combining eye-in-hand perception with relative or delta action parameterization yields inherent SE(3)-invariance, thus improving policy generalization. We then perform a systematic experimental study on those design choices for integrating symmetry in diffusion policies, and conclude that an invariant representation with equivariant feature extraction significantly improves the policy performance. Our method achieves performance on par with or exceeding fully equivariant architectures while greatly simplifying implementation.

arxiv情報

著者 Dian Wang,Boce Hu,Shuran Song,Robin Walters,Robert Platt
発行日 2025-05-19 17:55:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | A Practical Guide for Incorporating Symmetry in Diffusion Policy はコメントを受け付けていません

GraspMolmo: Generalizable Task-Oriented Grasping via Large-Scale Synthetic Data Generation

要約

一般化可能なオープンボキャブラリータスク指向の握り(TOG)モデルであるGrasmolmoを紹介します。
Graspmolmoは、自然言語の指示と単一のRGB-Dフレームを条件付けした意味的に適切な安定した握りを予測します。
たとえば、「お茶を注ぐ」を考えると、Graspmolmoはその体ではなくティーポットハンドルを把握します。
小さなデータセット、単純な言語、整理されていないシーンによって制限されている以前のTOGメソッドとは異なり、GraspmolmoはPrismから学びます。これは、乱雑な環境と多様で現実的なタスクの説明を特徴とする379kサンプルの新しい大規模な合成データセットです。
このデータに関するMolmo Visual-Languageモデルを微調整して、Graspmolmoが新しいオープンボキャブラリーの指示とオブジェクトに一般化できるようにします。
挑戦的な現実世界の評価では、Graspmolmoは、次の最高の代替手段によって達成された35%と比較して、複雑なタスクで70%の予測の成功を収めて、最先端の結果を達成します。
Graspmolmoはまた、意味的に修正されたバイマニュアルグラスクゼロショットを予測する能力を成功裏に実証しています。
合成データセット、コード、モデル、およびベンチマークをリリースして、タスクセマンティックロボット操作の研究を加速します。これは、ビデオとともにhttps://abhaybd.github.io/graspmolmo/で入手できます。

要約(オリジナル)

We present GrasMolmo, a generalizable open-vocabulary task-oriented grasping (TOG) model. GraspMolmo predicts semantically appropriate, stable grasps conditioned on a natural language instruction and a single RGB-D frame. For instance, given ‘pour me some tea’, GraspMolmo selects a grasp on a teapot handle rather than its body. Unlike prior TOG methods, which are limited by small datasets, simplistic language, and uncluttered scenes, GraspMolmo learns from PRISM, a novel large-scale synthetic dataset of 379k samples featuring cluttered environments and diverse, realistic task descriptions. We fine-tune the Molmo visual-language model on this data, enabling GraspMolmo to generalize to novel open-vocabulary instructions and objects. In challenging real-world evaluations, GraspMolmo achieves state-of-the-art results, with a 70% prediction success on complex tasks, compared to the 35% achieved by the next best alternative. GraspMolmo also successfully demonstrates the ability to predict semantically correct bimanual grasps zero-shot. We release our synthetic dataset, code, model, and benchmarks to accelerate research in task-semantic robotic manipulation, which, along with videos, are available at https://abhaybd.github.io/GraspMolmo/.

arxiv情報

著者 Abhay Deshpande,Yuquan Deng,Arijit Ray,Jordi Salvador,Winson Han,Jiafei Duan,Kuo-Hao Zeng,Yuke Zhu,Ranjay Krishna,Rose Hendrix
発行日 2025-05-19 17:59:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | GraspMolmo: Generalizable Task-Oriented Grasping via Large-Scale Synthetic Data Generation はコメントを受け付けていません

Unlabeled Data or Pre-trained Model: Rethinking Semi-Supervised Learning and Pretrain-Finetuning

要約

半教師の学習(SSL)は、非標識データを活用することにより、データラベル付けプロセスのコストを緩和し、画像分類などのさまざまなタスクで有望な結果を達成しています。
一方、プレレイン前獲得のパラダイムは近年かなりの注目を集めており、事前に訓練されたモデルを活用すると、下流タスクのラベル付きデータの要件も削減できます。
したがって、質問が自然に発生します。\ emph {ラベル付きデータがターゲットタスクで不足している場合、ラベル付けされていないデータまたは事前に訓練されたモデルを悪用する必要がありますか?}
使用されるラベル付きデータの量。
さまざまな設定にわたる広範な実験は、データの解像度が低いか明確なセマンティック構造がない場合を除き、ほぼすべての場合に、事前に訓練されたVLMが一般にSSLメソッドを上回ることを示しています。
したがって、将来のSSL研究に、事前に訓練されたモデルと比較し、事前に訓練された知識を使用して擬似標識を強化するなど、より深い統合を探求することを奨励します。
将来の研究をサポートするために、統一された複製と評価のフレームワークをリリースします。
コードはhttps://anonymous.4open.science/r/Rethinking-ssl-and-pretrain-finetuning-5566で入手できます

要約(オリジナル)

Semi-supervised learning (SSL) alleviates the cost of data labeling process by exploiting unlabeled data, and has achieved promising results on various tasks such as image classification. Meanwhile, the Pretrain-Finetuning paradigm has garnered significant attention in recent years, and exploiting pre-trained models could also reduce the requirement of labeled data in downstream tasks. Therefore, a question naturally occurs: \emph{When the labeled data is scarce in the target tasks, should we exploit unlabeled data or pre-trained models?} To answer this question, we select pre-trained Vision-Language Models (VLMs) as representative pretrain-finetuning instances and propose \textit{Few-shot SSL} — a framework that enables fair comparison between these two paradigms by controlling the amount of labeled data used. Extensive experiments across various settings demonstrate that pre-trained VLMs generally outperform SSL methods in nearly all cases, except when the data has low resolution or lacks clear semantic structure. Therefore, we encourage future SSL research to compare with pre-trained models and explore deeper integration, such as using pre-trained knowledge to enhance pseudo-labeling. To support future research, we release our unified reproduction and evaluation framework. Codes are available at https://anonymous.4open.science/r/Rethinking-SSL-and-Pretrain-Finetuning-5566

arxiv情報

著者 Song-Lin Li,Rui Zhu,Yu-Feng Li,Lan-Zhe Guo
発行日 2025-05-19 16:29:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Unlabeled Data or Pre-trained Model: Rethinking Semi-Supervised Learning and Pretrain-Finetuning はコメントを受け付けていません

ELECTRA: A Cartesian Network for 3D Charge Density Prediction with Floating Orbitals

要約

電子テンソル再構成アルゴリズム(Electra) – 浮動軌道を使用して電子電荷密度を予測するための等量モデルを提示します。
フローティング軌道は、すべての軌道を原子の位置に中心にするのではなく、軌道を空間に自由に配置することにより、よりコンパクトで正確な表現を約束する量子化学コミュニティの長年の概念です。
ただし、これらの軌道の理想的な配置を見つけるには、広範なドメインの知識が必要であり、これまでのところ広範な採用が妨げられています。
軌道係数とともに軌道位置を予測するために、デカルトテンソルネットワークをトレーニングすることにより、データ駆動型の方法でこれを解決します。
これは、電荷密度自体の回転等量を維持しながら、入力分子よりも低い対称性の位置変位を学習するために使用される対称的な破壊メカニズムによって可能になります。
宇宙の密度を表すガウスの飛び散の最近の成功に触発され、ガウス軌道を使用し、その重量と共分散行列を予測しています。
私たちの方法は、確立されたベンチマークでの計算効率と予測精度の間の最先端のバランスを達成します。

要約(オリジナル)

We present the Electronic Tensor Reconstruction Algorithm (ELECTRA) – an equivariant model for predicting electronic charge densities using floating orbitals. Floating orbitals are a long-standing concept in the quantum chemistry community that promises more compact and accurate representations by placing orbitals freely in space, as opposed to centering all orbitals at the position of atoms. Finding the ideal placement of these orbitals requires extensive domain knowledge, though, which thus far has prevented widespread adoption. We solve this in a data-driven manner by training a Cartesian tensor network to predict the orbital positions along with orbital coefficients. This is made possible through a symmetry-breaking mechanism that is used to learn position displacements with lower symmetry than the input molecule while preserving the rotation equivariance of the charge density itself. Inspired by recent successes of Gaussian Splatting in representing densities in space, we are using Gaussian orbitals and predicting their weights and covariance matrices. Our method achieves a state-of-the-art balance between computational efficiency and predictive accuracy on established benchmarks.

arxiv情報

著者 Jonas Elsborg,Luca Thiede,Alán Aspuru-Guzik,Tejs Vegge,Arghya Bhowmik
発行日 2025-05-19 16:30:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.chem-ph, physics.comp-ph | ELECTRA: A Cartesian Network for 3D Charge Density Prediction with Floating Orbitals はコメントを受け付けていません

Thinking Short and Right Over Thinking Long: Serving LLM Reasoning Efficiently and Accurately

要約

テストタイムスケーリングの最近の進歩は、大きな言語モデル(LLM)が、特定の要求に応答するために考えられたチェーン推論(人間の思考に類似)を生成することにより、より良い能力を獲得し、その間、より多くの推論ブランチを探索すること(つまり、複数の応答を生成し、それらをアンサンする)が最終的な出力の品質を改善することを示唆しています。
ただし、2つのスケーリング寸法を組み込む場合、2つの理由でシステムの効率が大幅に減衰されることがわかります。
第一に、最終的な出力を生成するための時間コストは、多くの推論ブランチが過度に考えられているジレンマに閉じ込められ、過度に長い反応を生み出すため、大幅に増加します。
第二に、各リクエストの複数の推論ブランチを生成すると、メモリ消費が増加します。これは、同時に処理するための限られた数の要求のみをバッチすることができるため、LLMのサービングには適していません。
これに対処するために、効率的かつ正確なLLM推論のためのサービングフレームワークであるSARTを提示します。
本質的なアイデアは、長くではなく、短くて正しいと思考を管理することです。
一つには、経験的観察と理論分析に基づいて、早期停止アプローチを備えた冗長サンプリングを考案します。
もう1つは、低品質の分岐のみを動的に剪定することを提案して、右に考えているブランチのみが維持され、メモリ消費量を減らし、より多くのリクエストをバッチできるようにします。
実験結果は、SARTがLLMの推論の精度を改善するだけでなく、サービング効率を向上させ、既存の方法を最大28.2倍、同じレベルの精度を達成するときの効率の面で平均15.7倍を上回ることを示しています。

要約(オリジナル)

Recent advances in test-time scaling suggest that Large Language Models (LLMs) can gain better capabilities by generating Chain-of-Thought reasoning (analogous to human thinking) to respond a given request, and meanwhile exploring more reasoning branches (i.e., generating multiple responses and ensembling them) can improve the final output quality. However, when incorporating the two scaling dimensions, we find that the system efficiency is dampened significantly for two reasons. Firstly, the time cost to generate the final output increases substantially as many reasoning branches would be trapped in the over-thinking dilemma, producing excessively long responses. Secondly, generating multiple reasoning branches for each request increases memory consumption, which is unsuitable for LLM serving since we can only batch a limited number of requests to process simultaneously. To address this, we present SART, a serving framework for efficient and accurate LLM reasoning. The essential idea is to manage the thinking to be short and right, rather than long. For one thing, we devise a redundant sampling with early stopping approach based on empirical observations and theoretic analysis, which increases the likelihood of obtaining short-thinking responses when sampling reasoning branches. For another, we propose to dynamically prune low-quality branches so that only right-thinking branches are maintained, reducing the memory consumption and allowing us to batch more requests. Experimental results demonstrate that SART not only improves the accuracy of LLM reasoning but also enhances the serving efficiency, outperforming existing methods by up to 28.2 times and on average 15.7 times in terms of efficiency when achieving the same level of accuracy.

arxiv情報

著者 Yuhang Wang,Youhe Jiang,Bin Cui,Fangcheng Fu
発行日 2025-05-19 16:34:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Thinking Short and Right Over Thinking Long: Serving LLM Reasoning Efficiently and Accurately はコメントを受け付けていません

Measuring Social Influence with Networked Synthetic Control

要約

カウンターファクタルと比較の欠如により、社会的影響を測定することは困難です。
機械学習ベースのモデリングとネットワーク科学を組み合わせることにより、社会的価値の一般的な特性を提示します。これは、政治的行動に適用される合成制御を使用した社会的影響の最近の尺度です。
社会的価値は、対象の出力変数を予測し、影響の合成尺度を生成し、ソーシャルネットワークに基づいて個々の貢献を分配するために外部レグレッサーに依存しているという点で、中心性の測定値とは異なります。
理論的導出により、格子ネットワーク、パワーローネットワーク、およびランダムグラフを介した、相互作用のある場合とない場合の線形回帰下でSVの特性を示します。
あらゆるアンサンブルモデルで計算の削減を達成できます。
シミュレーションを通じて、一般化された友情のパラドックスが保持していることがわかります。特定の状況では、あなたの友人はあなたよりも平均してより多くの影響力を持っています。

要約(オリジナル)

Measuring social influence is difficult due to the lack of counter-factuals and comparisons. By combining machine learning-based modeling and network science, we present general properties of social value, a recent measure for social influence using synthetic control applicable to political behavior. Social value diverges from centrality measures on in that it relies on an external regressor to predict an output variable of interest, generates a synthetic measure of influence, then distributes individual contribution based on a social network. Through theoretical derivations, we show the properties of SV under linear regression with and without interaction, across lattice networks, power-law networks, and random graphs. A reduction in computation can be achieved for any ensemble model. Through simulation, we find that the generalized friendship paradox holds — that in certain situations, your friends have on average more influence than you do.

arxiv情報

著者 Ho-Chun Herbert Chang
発行日 2025-05-19 16:44:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SI | Measuring Social Influence with Networked Synthetic Control はコメントを受け付けていません