EcoWeedNet: A Lightweight and Automated Weed Detection Method for Sustainable Next-Generation Agricultural Consumer Electronics

要約

持続可能な農業は、消費者の世界の食料安全保障を確保する上で重要な役割を果たしています。
持続可能な精密農業が直面する重要な課題は、雑草が水、土壌栄養素、日光などの作物との重要な資源を競うため、雑草の成長です。
自動化されたコンピュータービジョンテクノロジーと地上農業の消費者電子車両の採用は、精密農業において、持続可能な低炭素ソリューションを提供します。
ただし、以前の作業は、精度と精度の低さ、および高い計算費用などの問題に悩まされています。
この作業は、低炭素の農業慣行の目標と一致して、重要な計算の複雑さを導入することなく雑草検出性能を高める新しいモデルであるEcoWeedNetを提案しています。
提案されたモデルの有効性は、実際のシナリオを反映したCottonWeedDet12ベンチマークデータセットでの包括的な実験を通じて実証されています。
EcoWeedNetは、大規模なモデル(map@0.5 = 95.2%)のパフォーマンスに匹敵するパフォーマンスを達成しますが、パラメーターが大幅に少なくなり(Yolov4のパラメーターの約4.21%)、計算の複雑さが低く、Yolov4のGFLOPの6.59%が優れています。
これらの重要な調査結果は、低電力消費者ハードウェア、エネルギー消費の低下に対するEcoWeedNetの展開性を示しているため、二酸化炭素排出量が減少し、それにより、次世代の持続可能な農業におけるEcoWeedNetのアプリケーションの見通しを強調しています。
これらの調査結果は、環境に優しい農業消費者技術の適用を増やすための前進を提供します。

要約(オリジナル)

Sustainable agriculture plays a crucial role in ensuring world food security for consumers. A critical challenge faced by sustainable precision agriculture is weed growth, as weeds compete for essential resources with crops, such as water, soil nutrients, and sunlight, which notably affect crop yields. The adoption of automated computer vision technologies and ground agricultural consumer electronic vehicles in precision agriculture offers sustainable, low-carbon solutions. However, prior works suffer from issues such as low accuracy and precision, as well as high computational expense. This work proposes EcoWeedNet, a novel model that enhances weed detection performance without introducing significant computational complexity, aligning with the goals of low-carbon agricultural practices. The effectiveness of the proposed model is demonstrated through comprehensive experiments on the CottonWeedDet12 benchmark dataset, which reflects real-world scenarios. EcoWeedNet achieves performance comparable to that of large models (mAP@0.5 = 95.2%), yet with significantly fewer parameters (approximately 4.21% of the parameters of YOLOv4), lower computational complexity and better computational efficiency 6.59% of the GFLOPs of YOLOv4). These key findings indicate EcoWeedNet’s deployability on low-power consumer hardware, lower energy consumption, and hence reduced carbon footprint, thereby emphasizing the application prospects of EcoWeedNet in next-generation sustainable agriculture. These findings provide the way forward for increased application of environmentally-friendly agricultural consumer technologies.

arxiv情報

著者 Omar H. Khater,Abdul Jabbar Siddiqui,M. Shamim Hossain,Aiman El-Maleh
発行日 2025-05-07 11:40:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV | EcoWeedNet: A Lightweight and Automated Weed Detection Method for Sustainable Next-Generation Agricultural Consumer Electronics はコメントを受け付けていません

Multi-Granular Attention based Heterogeneous Hypergraph Neural Network

要約

不均一なグラフニューラルネットワーク(hetegnns)は、異種グラフで複雑な構造情報と意味情報を効果的に抽出することにより、ノード表現を学習する強力な能力を実証しています。
一般的なhetegnnsのほとんどは、近隣の集約パラダイムに従い、メタパスベースのメッセージの合格を活用して潜在的なノード表現を学習します。
ただし、メタパスのペアワイズ性により、これらのモデルはノード間の高次の関係をキャプチャできず、最適ではないパフォーマンスが発生します。
さらに、ヘテグンでの長距離メッセージが渡される「クランシング過剰」の課題は、深刻な情報の歪みにつながり、これらのモデルの有効性をさらに制限します。
これらの制限に対処するために、このホワイトペーパーでは、異種グラフ表現学習のための多粒の注意に基づいた不均一なハイパーグラフニューラルネットワークであるMGA-HHNを提案します。
MGA-HHNは、2つの重要なイノベーションを導入します。(1)複数のビューを通じて異種グラフの高次セマンティック情報を明示的にモデル化するメタパスベースの異種ハイパーグラフを構築するための新しいアプローチと、(2)ノードとハイパーエッジレベルで動作する多粒の注意メカニズム。
このメカニズムにより、モデルは、ハイパーエッジタイプ内で同じセマンティックコンテキストを共有するノード間で細粒の相互作用をキャプチャし、異なるハイパーエッジタイプにわたってセマンティクスの多様性を維持します。
そのため、MGA-HHNは長距離メッセージの歪みを効果的に軽減し、より表現力のあるノード表現を生成します。
実世界のベンチマークデータセットでの広範な実験は、MGA-HHNが最先端のモデルを上回り、ノード分類、ノードクラスタリング、視覚化タスクにおける有効性を紹介することを示しています。

要約(オリジナル)

Heterogeneous graph neural networks (HeteGNNs) have demonstrated strong abilities to learn node representations by effectively extracting complex structural and semantic information in heterogeneous graphs. Most of the prevailing HeteGNNs follow the neighborhood aggregation paradigm, leveraging meta-path based message passing to learn latent node representations. However, due to the pairwise nature of meta-paths, these models fail to capture high-order relations among nodes, resulting in suboptimal performance. Additionally, the challenge of “over-squashing”, where long-range message passing in HeteGNNs leads to severe information distortion, further limits the efficacy of these models. To address these limitations, this paper proposes MGA-HHN, a Multi-Granular Attention based Heterogeneous Hypergraph Neural Network for heterogeneous graph representation learning. MGA-HHN introduces two key innovations: (1) a novel approach for constructing meta-path based heterogeneous hypergraphs that explicitly models higher-order semantic information in heterogeneous graphs through multiple views, and (2) a multi-granular attention mechanism that operates at both the node and hyperedge levels. This mechanism enables the model to capture fine-grained interactions among nodes sharing the same semantic context within a hyperedge type, while preserving the diversity of semantics across different hyperedge types. As such, MGA-HHN effectively mitigates long-range message distortion and generates more expressive node representations. Extensive experiments on real-world benchmark datasets demonstrate that MGA-HHN outperforms state-of-the-art models, showcasing its effectiveness in node classification, node clustering and visualization tasks.

arxiv情報

著者 Hong Jin,Kaicheng Zhou,Jie Yin,Lan You,Zhifeng Zhou
発行日 2025-05-07 11:42:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Multi-Granular Attention based Heterogeneous Hypergraph Neural Network はコメントを受け付けていません

Enhancing Metabolic Syndrome Prediction with Hybrid Data Balancing and Counterfactuals

要約

メタボリックシンドローム(METS)は、心血管疾患と2型糖尿病のリスクを大幅に増加させる相互に関連する危険因子のクラスターです。
その世界的な有病率にもかかわらず、MetSの正確な予測は、既存の研究における階級の不均衡、データの希少性、方法論的な矛盾などの問題のために依然として挑戦的です。
このホワイトペーパーでは、METS予測の機械学習(ML)モデルを体系的に評価および最適化し、高度なデータバランス技術と反事実分析を活用することにより、これらの課題に対処します。
Xgboost、ランダムフォレスト、TabNetなどを含む複数のMLモデルを、ランダムオーバーサンプリング(ROS)、Smote、Adasyn、CTGANなどのさまざまなデータバランスの手法で訓練および比較しました。
さらに、Smote、Adasyn、およびCTGANを統合する新しいハイブリッドフレームワークであるMetaboostを紹介し、加重平均化と反復重量調整を通じて合成データ生成を最適化して、モデルのパフォーマンスを向上させます(個々のバランス技術よりも最大1.87%の精度改善を達成します)。
包括的な反事実分析が行われ、個人が高リスクカテゴリから低リスクカテゴリにシフトするために必要な機能レベルの変更を定量化します。
結果は、血糖(50.3%)とトリグリセリド(46.7%)が最も頻繁に修正された特徴であり、METSのリスク低下における臨床的意義を強調したことを示しています。
さらに、確率的分析では、血糖値の上昇(85.5%の尤度)とトリグリセリド(74.9%の事後確率)が最も強力な予測因子として示されています。
この研究は、METSの予測の方法論的な厳密さを進めるだけでなく、臨床医と研究者に実用的な洞察を提供し、メタボリックシンドロームの公衆衛生負担を軽減するMLの可能性を強調しています。

要約(オリジナル)

Metabolic Syndrome (MetS) is a cluster of interrelated risk factors that significantly increases the risk of cardiovascular diseases and type 2 diabetes. Despite its global prevalence, accurate prediction of MetS remains challenging due to issues such as class imbalance, data scarcity, and methodological inconsistencies in existing studies. In this paper, we address these challenges by systematically evaluating and optimizing machine learning (ML) models for MetS prediction, leveraging advanced data balancing techniques and counterfactual analysis. Multiple ML models, including XGBoost, Random Forest, TabNet, etc., were trained and compared under various data balancing techniques such as random oversampling (ROS), SMOTE, ADASYN, and CTGAN. Additionally, we introduce MetaBoost, a novel hybrid framework that integrates SMOTE, ADASYN, and CTGAN, optimizing synthetic data generation through weighted averaging and iterative weight tuning to enhance the model’s performance (achieving up to a 1.87% accuracy improvement over individual balancing techniques). A comprehensive counterfactual analysis is conducted to quantify the feature-level changes required to shift individuals from high-risk to low-risk categories. The results indicate that blood glucose (50.3%) and triglycerides (46.7%) were the most frequently modified features, highlighting their clinical significance in MetS risk reduction. Additionally, probabilistic analysis shows elevated blood glucose (85.5% likelihood) and triglycerides (74.9% posterior probability) as the strongest predictors. This study not only advances the methodological rigor of MetS prediction but also provides actionable insights for clinicians and researchers, highlighting the potential of ML in mitigating the public health burden of metabolic syndrome.

arxiv情報

著者 Sanyam Paresh Shah,Abdullah Mamun,Shovito Barua Soumma,Hassan Ghasemzadeh
発行日 2025-05-07 11:50:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Enhancing Metabolic Syndrome Prediction with Hybrid Data Balancing and Counterfactuals はコメントを受け付けていません

Uncertain Machine Ethics Planning

要約

機械の倫理決定は、決定に対する不確実性の意味を考慮する必要があります。
長期的に好ましい結果に到達するために、一連のアクションを介して決定する必要があります。
ただし、結果の評価は、1つ以上の道徳的理論を呼び起こす可能性があります。
各理論には、倫理的状況の異なる表現が必要になります。
たとえば、功利主義は数値的価値を測定し、デントロジーは義務を分析し、美徳倫理は道徳的な性格を強調しています。
潜在的に矛盾する道徳的考慮事項のバランスをとっていますが、たとえば、最小限のコストで道徳的に中立的な目標を達成するために、決定を下す必要がある場合があります。
このホワイトペーパーでは、問題を多動物マルコフの決定プロセスおよび多動的確率的最短経路問題として形式化します。
不確実性の下での倫理的推論のために、Sven-ove Hanssonの仮説的な回復手順を利用して、多目的AO*に基づいたヒューリスティックアルゴリズムを開発します。
私たちのアプローチは、機械倫理文献のケーススタディによって検証されています。それを必要とする人のためにインスリンを盗むかどうかの問題。

要約(オリジナル)

Machine Ethics decisions should consider the implications of uncertainty over decisions. Decisions should be made over sequences of actions to reach preferable outcomes long term. The evaluation of outcomes, however, may invoke one or more moral theories, which might have conflicting judgements. Each theory will require differing representations of the ethical situation. For example, Utilitarianism measures numerical values, Deontology analyses duties, and Virtue Ethics emphasises moral character. While balancing potentially conflicting moral considerations, decisions may need to be made, for example, to achieve morally neutral goals with minimal costs. In this paper, we formalise the problem as a Multi-Moral Markov Decision Process and a Multi-Moral Stochastic Shortest Path Problem. We develop a heuristic algorithm based on Multi-Objective AO*, utilising Sven-Ove Hansson’s Hypothetical Retrospection procedure for ethical reasoning under uncertainty. Our approach is validated by a case study from Machine Ethics literature: the problem of whether to steal insulin for someone who needs it.

arxiv情報

著者 Simon Kolker,Louise A. Dennis,Ramon Fraga Pereira,Mengwei Xu
発行日 2025-05-07 12:03:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CY | Uncertain Machine Ethics Planning はコメントを受け付けていません

Optimization Problem Solving Can Transition to Evolutionary Agentic Workflows

要約

このポジションペーパーでは、最適化の問題解決が専門家依存から進化的エージェントワークフローに移行できると主張しています。
従来の最適化の実践は、問題の定式化、アルゴリズムの選択、ハイパーパラメーターの調整に人間の専門家に依存しており、最先端の方法の産業採用を妨げるボトルネックを作成します。
基礎モデルと進化的検索を搭載した進化エージェントワークフローは、問題、定式化、アルゴリズム、およびハイパーパラメータースペースを含む最適化空間を自律的にナビゲートできると主張します。
クラウドリソースのスケジューリングとADMMパラメーターの適応でのケーススタディを通じて、このアプローチが学術革新と産業実装の間のギャップをどのように埋めることができるかを示します。
私たちの立場は、人間中心の最適化ワークフローの現状に挑戦し、実際の最適化の問題を解決するためのよりスケーラブルで適応的なアプローチを提唱しています。

要約(オリジナル)

This position paper argues that optimization problem solving can transition from expert-dependent to evolutionary agentic workflows. Traditional optimization practices rely on human specialists for problem formulation, algorithm selection, and hyperparameter tuning, creating bottlenecks that impede industrial adoption of cutting-edge methods. We contend that an evolutionary agentic workflow, powered by foundation models and evolutionary search, can autonomously navigate the optimization space, comprising problem, formulation, algorithm, and hyperparameter spaces. Through case studies in cloud resource scheduling and ADMM parameter adaptation, we demonstrate how this approach can bridge the gap between academic innovation and industrial implementation. Our position challenges the status quo of human-centric optimization workflows and advocates for a more scalable, adaptive approach to solving real-world optimization problems.

arxiv情報

著者 Wenhao Li,Bo Jin,Mingyi Hong,Changhong Lu,Xiangfeng Wang
発行日 2025-05-07 12:07:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, math.OC | Optimization Problem Solving Can Transition to Evolutionary Agentic Workflows はコメントを受け付けていません

From Latent to Lucid: Transforming Knowledge Graph Embeddings into Interpretable Structures with KGEPrisma

要約

このホワイトペーパーでは、知識グラフ埋め込み(KGE)モデルに合わせて調整された事後およびローカルの説明可能なAIメソッドを紹介します。
これらのモデルは、知識グラフの完了に不可欠ですが、不透明でブラックボックスの性質について批判されています。
高次元の潜在表現を通じて知識グラフのセマンティクスをキャプチャすることに大きな成功を収めたにもかかわらず、それらの固有の複雑さは、説明可能性に大きな課題をもたらします。
Kelpieのような既存の方法はリソース集約型の摂動を使用してKGEモデルを説明しますが、私たちのアプローチはKGEモデルによってエンコードされた潜在表現を直接解読し、埋め込みの滑らかさを活用します。
この原則は一般に滑らかさと呼ばれます。
同様に埋め込まれたエンティティのサブグラフ近傍内で、トリプルの形で象徴的な構造を識別することにより、私たちの方法は、モデルがこれらの洞察を人間に理解しやすい象徴的なルールと事実に依存して変換する統計的規則性を特定します。
これにより、KGEモデルの抽象表現とその予測出力との間のギャップが架けられ、明確で解釈可能な洞察を提供します。
主な貢献には、再訓練なしで即座に忠実な説明を提供するKGEモデルのための新しい事後およびローカル説明可能なAIメソッドが含まれ、大規模な知識グラフでのリアルタイムアプリケーションを促進します。
この方法の柔軟性により、ルールベース、インスタンスベース、および類推ベースの説明の生成が可能になり、多様なユーザーのニーズを満たします。
広範な評価は、忠実でよく想定された説明を提供し、KGEモデルの透明性と信頼性を高める際のアプローチの有効性を示しています。

要約(オリジナル)

In this paper, we introduce a post-hoc and local explainable AI method tailored for Knowledge Graph Embedding (KGE) models. These models are essential to Knowledge Graph Completion yet criticized for their opaque, black-box nature. Despite their significant success in capturing the semantics of knowledge graphs through high-dimensional latent representations, their inherent complexity poses substantial challenges to explainability. While existing methods like Kelpie use resource-intensive perturbation to explain KGE models, our approach directly decodes the latent representations encoded by KGE models, leveraging the smoothness of the embeddings, which follows the principle that similar embeddings reflect similar behaviours within the Knowledge Graph, meaning that nodes are similarly embedded because their graph neighbourhood looks similar. This principle is commonly referred to as smoothness. By identifying symbolic structures, in the form of triples, within the subgraph neighborhoods of similarly embedded entities, our method identifies the statistical regularities on which the models rely and translates these insights into human-understandable symbolic rules and facts. This bridges the gap between the abstract representations of KGE models and their predictive outputs, offering clear, interpretable insights. Key contributions include a novel post-hoc and local explainable AI method for KGE models that provides immediate, faithful explanations without retraining, facilitating real-time application on large-scale knowledge graphs. The method’s flexibility enables the generation of rule-based, instance-based, and analogy-based explanations, meeting diverse user needs. Extensive evaluations show the effectiveness of our approach in delivering faithful and well-localized explanations, enhancing the transparency and trustworthiness of KGE models.

arxiv情報

著者 Christoph Wehner,Chrysa Iliopoulou,Ute Schmid,Tarek R. Besold
発行日 2025-05-07 12:15:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI | From Latent to Lucid: Transforming Knowledge Graph Embeddings into Interpretable Structures with KGEPrisma はコメントを受け付けていません

VecCity: A Taxonomy-guided Library for Map Entity Representation Learning

要約

電子マップは、関心のあるポイント(POI)、道路ネットワーク、土地区画などの多様なエンティティで構成され、ITやLBSなどのアプリケーションで重要な役割を果たしています。
MAPエンティティ表現学習(MAPRL)は、多用途で再利用可能なデータ表現を生成し、MAPエンティティデータを効率的に管理および利用するための不可欠なツールを提供します。
MAPRLの進歩にもかかわらず、2つの重要な課題がさらなる開発を制約します。
まず、既存の研究は断片化されており、モデルはMAPエンティティのタイプによって分類され、さまざまなタスクにわたるテクニックの再利用性を制限します。
第二に、統一されたベンチマークがないため、モデルの体系的な評価と比較が困難になります。
これらの課題に対処するために、エンコーダー、トレーニング前のタスク、および下流のタスクに基づいてモデルを整理するMAPRLの新しい分類法を提案します。
この分類法に基づいて、分類駆動型のライブラリであるVeccityを紹介します。これは、エンコード、プリトレーニング、微調整、および評価のための使いやすいインターフェイスを提供します。
ライブラリは、9つの都市のデータセットを統合し、21の主流MAPRLモデルを再現し、フィールドの最初の標準化されたベンチマークを確立します。
また、Veccityを使用すると、ユーザーはモジュラーコンポーネントを介してモデルを変更および拡張し、シームレスな実験を促進することもできます。
当社の包括的な実験は、さまざまなタイプのマップエンティティをカバーし、さまざまな下流タスクにわたって21のVeccity事前に構築されたモデルを評価します。
実験結果は、モデル開発の合理化におけるVeccityの有効性を示し、パフォーマンスに対するさまざまなコンポーネントの影響に関する洞察を提供します。
モジュラーの設計と再利用性を促進することにより、VeccityはMAPRLの研究と革新を促進するための統一されたフレームワークを提供します。
このコードは、https://github.com/bigscity-veccity/veccityで入手できます。

要約(オリジナル)

Electronic maps consist of diverse entities, such as points of interest (POIs), road networks, and land parcels, playing a vital role in applications like ITS and LBS. Map entity representation learning (MapRL) generates versatile and reusable data representations, providing essential tools for efficiently managing and utilizing map entity data. Despite the progress in MapRL, two key challenges constrain further development. First, existing research is fragmented, with models classified by the type of map entity, limiting the reusability of techniques across different tasks. Second, the lack of unified benchmarks makes systematic evaluation and comparison of models difficult. To address these challenges, we propose a novel taxonomy for MapRL that organizes models based on functional module-such as encoders, pre-training tasks, and downstream tasks-rather than by entity type. Building on this taxonomy, we present a taxonomy-driven library, VecCity, which offers easy-to-use interfaces for encoding, pre-training, fine-tuning, and evaluation. The library integrates datasets from nine cities and reproduces 21 mainstream MapRL models, establishing the first standardized benchmarks for the field. VecCity also allows users to modify and extend models through modular components, facilitating seamless experimentation. Our comprehensive experiments cover multiple types of map entities and evaluate 21 VecCity pre-built models across various downstream tasks. Experimental results demonstrate the effectiveness of VecCity in streamlining model development and provide insights into the impact of various components on performance. By promoting modular design and reusability, VecCity offers a unified framework to advance research and innovation in MapRL. The code is available at https://github.com/Bigscity-VecCity/VecCity.

arxiv情報

著者 Wentao Zhang,Jingyuan Wang,Yifan Yang,Leong Hou U
発行日 2025-05-07 12:26:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | VecCity: A Taxonomy-guided Library for Map Entity Representation Learning はコメントを受け付けていません

Balancing Accuracy, Calibration, and Efficiency in Active Learning with Vision Transformers Under Label Noise

要約

下流タスクのImagenet上の事前に訓練された畳み込みニューラルネットワークを微調整することは十分に確立されています。
それでも、特にラベルノイズの下での同様のシナリオでの視覚変圧器のパフォーマンスに対するモデルサイズの影響は、ほとんど説明されていません。
トランスアーキテクチャの有用性と汎用性を考えると、この研究では、低予算の制約と騒々しいラベルの下での実用性を調査しています。
アクティブな学習設定における対称ラベルノイズの分類精度とキャリブレーションが、CIFAR10およびCIFAR100データセットの3つのSWINトランス構成(16×16および32×32パッチサイズのベースと大規模)と3つのSWINトランス構成(小さな、小さな、およびベース)を評価することで、分類の精度とキャリブレーションがどのように影響を受けるかを調査します。
私たちの調査結果は、より大きなVITモデル(特にVITL32)は、中程度から高ラベルノイズの下であっても、精度とキャリブレーションの両方でより小さな対応物を一貫して上回る一方で、すべてのノイズレベルでより弱い堅牢性を示すことを示しています。
VITL16は、より高い計算コストを発生させながらVITL32よりも一貫して悪化するため、パッチサイズが小さくなるとは限らないことがわかります。
また、情報ベースのアクティブ学習戦略は、中程度のラベルノイズレートで有意義な精度の改善を提供するだけですが、ランダムに取得したラベル、特に高ラベルノイズレートでトレーニングされたモデルと比較して、キャリブレーションが低下することがわかります。
これらの洞察が、モデルの複雑さ、ラベルノイズ、およびコンピューティング効率のバランスをとるリソースに制約のある環境に視力変圧器を展開しようとする実務家に実用的なガイダンスを提供することを願っています。モデルの微調整または蒸留において重要です。

要約(オリジナル)

Fine-tuning pre-trained convolutional neural networks on ImageNet for downstream tasks is well-established. Still, the impact of model size on the performance of vision transformers in similar scenarios, particularly under label noise, remains largely unexplored. Given the utility and versatility of transformer architectures, this study investigates their practicality under low-budget constraints and noisy labels. We explore how classification accuracy and calibration are affected by symmetric label noise in active learning settings, evaluating four vision transformer configurations (Base and Large with 16×16 and 32×32 patch sizes) and three Swin Transformer configurations (Tiny, Small, and Base) on CIFAR10 and CIFAR100 datasets, under varying label noise rates. Our findings show that larger ViT models (ViTl32 in particular) consistently outperform their smaller counterparts in both accuracy and calibration, even under moderate to high label noise, while Swin Transformers exhibit weaker robustness across all noise levels. We find that smaller patch sizes do not always lead to better performance, as ViTl16 performs consistently worse than ViTl32 while incurring a higher computational cost. We also find that information-based Active Learning strategies only provide meaningful accuracy improvements at moderate label noise rates, but they result in poorer calibration compared to models trained on randomly acquired labels, especially at high label noise rates. We hope these insights provide actionable guidance for practitioners looking to deploy vision transformers in resource-constrained environments, where balancing model complexity, label noise, and compute efficiency is critical in model fine-tuning or distillation.

arxiv情報

著者 Moseli Mots’oehli,Hope Mogale,Kyungim Baek
発行日 2025-05-07 12:53:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG | Balancing Accuracy, Calibration, and Efficiency in Active Learning with Vision Transformers Under Label Noise はコメントを受け付けていません

Consensus-Aware AV Behavior: Trade-offs Between Safety, Interaction, and Performance in Mixed Urban Traffic

要約

輸送システムは、エージェントのアクションとトラフィックの結果の相互依存関係によって駆動される、複雑さと不均一性によって長い間形作られてきました。
このようなシステムにおける自動化された車両(AVS)の展開は、安全性、相互作用の品質、交通性能を超えてコンセンサスを達成するという新しい課題をもたらします。
この作業では、コンセンサスをトラフィックシステムの基本的なプロパティとして位置付け、それを定量化することを目指しています。
第3世代シミュレーション(TGSIM)データセットの高解像度軌道データを使用して、シグナル付きの都市交差点および脆弱な道路利用者(VRU)でAVおよびヒト駆動車(HDV)の動作を経験的に分析します。
衝突までの時間(TTC)、侵入後の時間(PET)、減速パターン、前進、および文字列安定性を含む重要なメトリックは、3つのパフォーマンスの次元で評価されます。
結果は、安全性、相互作用、パフォーマンス全体の完全なコンセンサスがまれであり、AV-VRU相互作用フレームのわずか3つの条件を満たしていることを示しています。
これらの調査結果は、混合環境での多次元パフォーマンスのバランスを明示的にバランスさせるAVモデルの必要性を強調しています。
完全な再現性は、https://github.com/wissamkontar/consensus-av-分析のオープンソースコードベースを介してサポートされています。

要約(オリジナル)

Transportation systems have long been shaped by complexity and heterogeneity, driven by the interdependency of agent actions and traffic outcomes. The deployment of automated vehicles (AVs) in such systems introduces a new challenge: achieving consensus across safety, interaction quality, and traffic performance. In this work, we position consensus as a fundamental property of the traffic system and aim to quantify it. We use high-resolution trajectory data from the Third Generation Simulation (TGSIM) dataset to empirically analyze AV and human-driven vehicle (HDV) behavior at a signalized urban intersection and around vulnerable road users (VRUs). Key metrics, including Time-to-Collision (TTC), Post-Encroachment Time (PET), deceleration patterns, headways, and string stability, are evaluated across the three performance dimensions. Results show that full consensus across safety, interaction, and performance is rare, with only 1.63% of AV-VRU interaction frames meeting all three conditions. These findings highlight the need for AV models that explicitly balance multi-dimensional performance in mixed-traffic environments. Full reproducibility is supported via our open-source codebase on https://github.com/wissamkontar/Consensus-AV-Analysis.

arxiv情報

著者 Mohammad Elayan,Wissam Kontar
発行日 2025-05-07 12:59:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.MA, cs.SY, eess.SY | Consensus-Aware AV Behavior: Trade-offs Between Safety, Interaction, and Performance in Mixed Urban Traffic はコメントを受け付けていません

Multi-Robot Motion Planning with Diffusion Models

要約

拡散モデルは最近、データから複雑なマルチモーダル動作を学習するための幅広いロボットアプリケーションに正常に適用されました。
ただし、以前の作品は、マルチロボット拡散モデルの学習のサンプルの複雑さが高いため、主にシングルロボットおよび小規模環境に限定されています。
この論文では、単一ロボットデータのみを使用しながら、基礎となるデータ分布に準拠する衝突のないマルチロボット軌跡を生成する方法を提案します。
当社のアルゴリズムであるマルチロボットマルチモデル計画拡散(MMD)は、学習した拡散モデルと古典的な検索ベースの手法を組み合わせて、衝突制約の下でデータ駆動型の動きを生成します。
さらにスケーリングすると、単一の拡散モデルがよく一般化できない大きな環境で計画するために複数の拡散モデルを構成する方法を示します。
ロジスティクス環境によって動機付けられたさまざまなシミュレートされたシナリオで、数十のロボットを計画する際のアプローチの有効性を実証します。
ビデオのデモンストレーションとコードを表示:https://multi-robot-diffusion.github.io/。

要約(オリジナル)

Diffusion models have recently been successfully applied to a wide range of robotics applications for learning complex multi-modal behaviors from data. However, prior works have mostly been confined to single-robot and small-scale environments due to the high sample complexity of learning multi-robot diffusion models. In this paper, we propose a method for generating collision-free multi-robot trajectories that conform to underlying data distributions while using only single-robot data. Our algorithm, Multi-robot Multi-model planning Diffusion (MMD), does so by combining learned diffusion models with classical search-based techniques — generating data-driven motions under collision constraints. Scaling further, we show how to compose multiple diffusion models to plan in large environments where a single diffusion model fails to generalize well. We demonstrate the effectiveness of our approach in planning for dozens of robots in a variety of simulated scenarios motivated by logistics environments. View video demonstrations and code at: https://multi-robot-diffusion.github.io/.

arxiv情報

著者 Yorai Shaoul,Itamar Mishani,Shivam Vats,Jiaoyang Li,Maxim Likhachev
発行日 2025-05-07 13:04:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.MA, cs.RO | Multi-Robot Motion Planning with Diffusion Models はコメントを受け付けていません