Optimized Cloud Resource Allocation Using Genetic Algorithms for Energy Efficiency and QoS Assurance

要約

クラウドコンピューティング環境には、最適なパフォーマンス、エネルギー消費の削減、サービスレベル契約の順守(SLA)を確保するために、動的で効率的なリソース管理が必要です。
このペーパーでは、QoS制約を維持しながら電力使用量を最小限に抑えることを目的とした、仮想マシン(VM)配置と統合のための遺伝的アルゴリズム(GA)ベースのアプローチを紹介します。
提案された方法は、リアルタイムワークロードのバリエーションに基づいてVM割り当てを動的に調整し、First Fit Declasing(FFD)やBest Fit Declasing(BFD)などの従来のヒューリスティックを上回ります。
実験結果は、エネルギー消費、VM移動、SLA違反率、および実行時間の著しい削減を示しています。
相関ヒートマップは、これらの主要なパフォーマンスインジケーター間の強い関係をさらに示し、クラウドリソースの利用を最適化する際のアプローチの有効性を確認します。

要約(オリジナル)

Cloud computing environments demand dynamic and efficient resource management to ensure optimal performance, reduced energy consumption, and adherence to Service Level Agreements (SLAs). This paper presents a Genetic Algorithm (GA)-based approach for Virtual Machine (VM) placement and consolidation, aiming to minimize power usage while maintaining QoS constraints. The proposed method dynamically adjusts VM allocation based on real-time workload variations, outperforming traditional heuristics such as First Fit Decreasing (FFD) and Best Fit Decreasing (BFD). Experimental results show notable reductions in energy consumption, VM migrations, SLA violation rates, and execution time. A correlation heatmap further illustrates strong relationships among these key performance indicators, confirming the effectiveness of our approach in optimizing cloud resource utilization.

arxiv情報

著者 Caroline Panggabean,Devaraj Verma C,Bhagyashree Gogoi,Ranju Limbu,Rhythm Sarker
発行日 2025-04-24 15:45:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DC | Optimized Cloud Resource Allocation Using Genetic Algorithms for Energy Efficiency and QoS Assurance はコメントを受け付けていません

INSIGHT: Bridging the Student-Teacher Gap in Times of Large Language Models

要約

AIの台頭、特に大規模な言語モデルは、そのような技術を教室に統合する課題と機会を提供します。
AIは、教育方法のパーソナライズなど、さまざまなタスクを教えるスタッフを支援することにより、教育に革命を起こす可能性がありますが、たとえば、学生と教師の相互作用やユーザープライバシーの劣化についても懸念を引き起こします。
このペーパーでは、概念の証明である洞察を紹介します。これは、さまざまなAIツールを組み合わせて、演習を解決する過程で教員と学生を支援するためです。
Insightには、さまざまな高等教育コースに統合できるモジュール設計があります。
キーワードを抽出することにより、学生の質問をLLMに分析します。これは、学生の質問からFAQを動的に構築し、よりパーソナライズされた対面サポートのために教育スタッフが使用するための新しい洞察を提供するために使用します。
将来の作業は、収集されたデータを使用して適応性のある学習を提供し、学生の進捗状況と学習スタイルに基づいてコンテンツを調整して、よりインタラクティブで包括的な学習体験を提供することにより、洞察に基づいて構築できます。

要約(オリジナル)

The rise of AI, especially Large Language Models, presents challenges and opportunities to integrate such technology into the classroom. AI has the potential to revolutionize education by helping teaching staff with various tasks, such as personalizing their teaching methods, but it also raises concerns, for example, about the degradation of student-teacher interactions and user privacy. This paper introduces INSIGHT, a proof of concept to combine various AI tools to assist teaching staff and students in the process of solving exercises. INSIGHT has a modular design that allows it to be integrated into various higher education courses. We analyze students’ questions to an LLM by extracting keywords, which we use to dynamically build an FAQ from students’ questions and provide new insights for the teaching staff to use for more personalized face-to-face support. Future work could build upon INSIGHT by using the collected data to provide adaptive learning and adjust content based on student progress and learning styles to offer a more interactive and inclusive learning experience.

arxiv情報

著者 Jarne Thys,Sebe Vanbrabant,Davy Vanacken,Gustavo Rovelo Ruiz
発行日 2025-04-24 15:47:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC | INSIGHT: Bridging the Student-Teacher Gap in Times of Large Language Models はコメントを受け付けていません

Ensemble Bayesian Inference: Leveraging Small Language Models to Achieve LLM-level Accuracy in Profile Matching Tasks

要約

この研究では、独自の大手言語モデル(LLM)に匹敵する精度を実現するための小言語モデル(SLM)アンサンブルの可能性を調査します。
アンサンブルベイジアン推論(EBI)を提案します。これは、複数のSLMからの判断を組み合わせてベイジアン推定を適用し、個々のモデルのパフォーマンス制限を超えることができる新しいアプローチです。
多様なタスクに関する実験(日本と英語の両方での適性評価と消費者プロファイル分析)は、EBIの有効性を示しています。
特に、ネガティブリフト値を持つモデルをアンサンブルに組み込むことにより、全体的なパフォーマンスが向上するケースを分析し、さまざまな言語での方法の有効性を調べます。
これらの調査結果は、限られた計算リソースを備えた高性能AIシステムを構築し、個別に低いパフォーマンスを持つモデルを効果的に利用するための新しい可能性を示唆しています。
LLMパフォーマンス評価、アンサンブル方法、およびオープンソースLLM利用に関する既存の研究に基づいて、アプローチの斬新さと重要性について説明します。

要約(オリジナル)

This study explores the potential of small language model(SLM) ensembles to achieve accuracy comparable to proprietary large language models (LLMs). We propose Ensemble Bayesian Inference (EBI), a novel approach that applies Bayesian estimation to combine judgments from multiple SLMs, allowing them to exceed the performance limitations of individual models. Our experiments on diverse tasks(aptitude assessments and consumer profile analysis in both Japanese and English) demonstrate EBI’s effectiveness. Notably, we analyze cases where incorporating models with negative Lift values into ensembles improves overall performance, and we examine the method’s efficacy across different languages. These findings suggest new possibilities for constructing high-performance AI systems with limited computational resources and for effectively utilizing models with individually lower performance. Building on existing research on LLM performance evaluation, ensemble methods, and open-source LLM utilization, we discuss the novelty and significance of our approach.

arxiv情報

著者 Haru-Tada Sato,Fuka Matsuzaki,Jun-ichiro Takahashi
発行日 2025-04-24 15:55:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | Ensemble Bayesian Inference: Leveraging Small Language Models to Achieve LLM-level Accuracy in Profile Matching Tasks はコメントを受け付けていません

Federated Learning: A Survey on Privacy-Preserving Collaborative Intelligence

要約

Federated Learning(FL)は、分散型機械学習の分野で変革的なパラダイムとして浮上し、モバイルデバイス、エッジノード、または組織などの複数のクライアントが、機密データを集中化する必要なく共有グローバルモデルを共同で訓練できるようにしました。
この分散型アプローチは、データのプライバシー、セキュリティ、規制のコンプライアンスに関する懸念の高まりに対処し、ヘルスケア、ファイナンス、スマートIoTシステムなどのドメインで特に魅力的です。
この調査では、コアアーキテクチャとコミュニケーションプロトコルから始まる、フェデレーション学習の簡潔で包括的な概要を提供します。
ローカルトレーニング、モデルの集約、グローバルアップデートなど、標準のFLライフサイクルについて説明します。
特に、非IID(非依存性と同一に分散された)データの処理、システムとハードウェアの不均一性の緩和、コミュニケーションオーバーヘッドの削減、差別的なプライバシーや安全性の集合などのメカニズムによるプライバシーの確保などの重要な技術的課題に特に重点が置かれています。
さらに、パーソナライズされたFL、クロスデバイスとクロスシロ設定、および強化学習や量子コンピューティングなどの他のパラダイムとの統合など、FL研究の新たな傾向を調べます。
また、実際のアプリケーションを強調し、FLの研究で一般的に使用されるベンチマークデータセットと評価メトリックを要約します。
最後に、スケーラブルで効率的で信頼できるFLシステムの開発を導くために、オープンな研究問題と将来の方向性の概要を説明します。

要約(オリジナル)

Federated Learning (FL) has emerged as a transformative paradigm in the field of distributed machine learning, enabling multiple clients such as mobile devices, edge nodes, or organizations to collaboratively train a shared global model without the need to centralize sensitive data. This decentralized approach addresses growing concerns around data privacy, security, and regulatory compliance, making it particularly attractive in domains such as healthcare, finance, and smart IoT systems. This survey provides a concise yet comprehensive overview of Federated Learning, beginning with its core architecture and communication protocol. We discuss the standard FL lifecycle, including local training, model aggregation, and global updates. A particular emphasis is placed on key technical challenges such as handling non-IID (non-independent and identically distributed) data, mitigating system and hardware heterogeneity, reducing communication overhead, and ensuring privacy through mechanisms like differential privacy and secure aggregation. Furthermore, we examine emerging trends in FL research, including personalized FL, cross-device versus cross-silo settings, and integration with other paradigms such as reinforcement learning and quantum computing. We also highlight real-world applications and summarize benchmark datasets and evaluation metrics commonly used in FL research. Finally, we outline open research problems and future directions to guide the development of scalable, efficient, and trustworthy FL systems.

arxiv情報

著者 Edward Collins,Michel Wang
発行日 2025-04-24 16:10:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Federated Learning: A Survey on Privacy-Preserving Collaborative Intelligence はコメントを受け付けていません

Early Detection of Multidrug Resistance Using Multivariate Time Series Analysis and Interpretable Patient-Similarity Representations

要約

背景と目的:多剤耐性(MDR)は重要な世界的な健康問題であり、病院の滞在、医療費、死亡率の増加を引き起こします。
この研究では、MDR予測のための解釈可能な機械学習(ML)フレームワークを提案し、正確な推論と説明可能性の強化の両方を目指しています。
方法:患者は多変量時系列(MTS)としてモデル化され、臨床的進行と患者と患者の相互作用を捕捉します。
患者間の類似性は、MTSベースの方法を使用して定量化されます:記述統計、動的タイムワーピング、およびタイムクラスターカーネル。
これらの類似性測定値は、ロジスティック回帰、ランダムフォレスト、およびサポートベクターマシンを介したMDR分類の入力として機能し、次元削減とカーネル変換によりモデルのパフォーマンスが向上します。
説明可能性のために、患者の類似性ネットワークはこれらのメトリックから構築されます。
スペクトルクラスタリングとT-SNEが適用され、MDR関連のサブグループを識別し、リスクの高いクラスターを視覚化し、臨床的に関連するパターンに関する洞察を可能にします。
結果:フレームワークは、フエンラブラダ大学病院のICU電子健康記録で検証され、81%のAUCを達成しました。
グラフベースの患者の類似性を活用することにより、ベースラインMLおよびディープラーニングモデルよりも優れています。
このアプローチは、抗生物質の長期使用、侵襲的手順、共感染、拡張ICUの滞在など、重要な危険因子を特定し、臨床的に意味のあるクラスターを明らかにします。
コードと結果は、\ https://github.com/oscarescuderoarnanz/dm4mtsで入手できます。
結論:グラフベースの分析と組み合わせた患者の類似性表現は、正確なMDR予測と解釈可能な洞察を提供します。
この方法は、早期の検出、危険因子の識別、および患者の層別化をサポートし、クリティカルケアにおける説明可能なMLの可能性を強調します。

要約(オリジナル)

Background and Objectives: Multidrug Resistance (MDR) is a critical global health issue, causing increased hospital stays, healthcare costs, and mortality. This study proposes an interpretable Machine Learning (ML) framework for MDR prediction, aiming for both accurate inference and enhanced explainability. Methods: Patients are modeled as Multivariate Time Series (MTS), capturing clinical progression and patient-to-patient interactions. Similarity among patients is quantified using MTS-based methods: descriptive statistics, Dynamic Time Warping, and Time Cluster Kernel. These similarity measures serve as inputs for MDR classification via Logistic Regression, Random Forest, and Support Vector Machines, with dimensionality reduction and kernel transformations improving model performance. For explainability, patient similarity networks are constructed from these metrics. Spectral clustering and t-SNE are applied to identify MDR-related subgroups and visualize high-risk clusters, enabling insight into clinically relevant patterns. Results: The framework was validated on ICU Electronic Health Records from the University Hospital of Fuenlabrada, achieving an AUC of 81%. It outperforms baseline ML and deep learning models by leveraging graph-based patient similarity. The approach identifies key risk factors — prolonged antibiotic use, invasive procedures, co-infections, and extended ICU stays — and reveals clinically meaningful clusters. Code and results are available at \https://github.com/oscarescuderoarnanz/DM4MTS. Conclusions: Patient similarity representations combined with graph-based analysis provide accurate MDR prediction and interpretable insights. This method supports early detection, risk factor identification, and patient stratification, highlighting the potential of explainable ML in critical care.

arxiv情報

著者 Óscar Escudero-Arnanz,Antonio G. Marques,Inmaculada Mora-Jiménez,Joaquín Álvarez-Rodríguez,Cristina Soguero-Ruiz
発行日 2025-04-24 16:19:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Early Detection of Multidrug Resistance Using Multivariate Time Series Analysis and Interpretable Patient-Similarity Representations はコメントを受け付けていません

Multilingual Performance Biases of Large Language Models in Education

要約

大規模な言語モデル(LLM)は、教育環境でますます採用されています。
現在のLLMは主に英語中心のままですが、これらのアプリケーションは英語を超えて拡大しています。
この作業では、英語以外の言語での教育環境での使用が保証されているかどうかを確認します。
英語に加えて、6つの言語(ヒンディー語、アラビア語、ペルシア語、テルグ語、ウクライナ語、チェック)で、学生の誤解を特定し、ターゲットを絞ったフィードバック、インタラクティブな家庭教師、グレーディング翻訳を識別し、ターゲットを絞ったフィードバックを提供し、ターゲットを絞ったフィードバックを提供し、ターゲットを絞ったフィードバックを提供します。
これらのタスクのパフォーマンスは、トレーニングデータで表される言語の量に多少対応しており、リソースの低い言語はタスクのパフォーマンスが低いことがわかります。
モデルはほとんどの言語でかなりうまく機能しますが、英語からの頻繁なパフォーマンス低下は重要です。
したがって、開業医は、展開前に教育タスクのためにLLMがターゲット言語でうまく機能することを最初に確認することをお勧めします。

要約(オリジナル)

Large language models (LLMs) are increasingly being adopted in educational settings. These applications expand beyond English, though current LLMs remain primarily English-centric. In this work, we ascertain if their use in education settings in non-English languages is warranted. We evaluated the performance of popular LLMs on four educational tasks: identifying student misconceptions, providing targeted feedback, interactive tutoring, and grading translations in six languages (Hindi, Arabic, Farsi, Telugu, Ukrainian, Czech) in addition to English. We find that the performance on these tasks somewhat corresponds to the amount of language represented in training data, with lower-resource languages having poorer task performance. Although the models perform reasonably well in most languages, the frequent performance drop from English is significant. Thus, we recommend that practitioners first verify that the LLM works well in the target language for their educational task before deployment.

arxiv情報

著者 Vansh Gupta,Sankalan Pal Chowdhury,Vilém Zouhar,Donya Rooein,Mrinmaya Sachan
発行日 2025-04-24 16:32:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | Multilingual Performance Biases of Large Language Models in Education はコメントを受け付けていません

Conformal Segmentation in Industrial Surface Defect Detection with Statistical Guarantees

要約

産業環境では、鋼の表面欠陥は、そのサービス寿命を大幅に損ない、潜在的な安全リスクを高めることができます。
従来の欠陥検出方法は、主に手動検査に依存しており、効率が低く、コストが高くなります。
畳み込みニューラルネットワーク(例:マスクR-CNN)に基づく自動化された欠陥検出アプローチは迅速に進歩していますが、深いモデルトレーニングと過剰適合の問題中のデータアノテーションの不確実性により、その信頼性は依然として挑戦されています。
これらの制限は、与えられた新しいテストサンプルを処理する際の検出偏差につながり、自動検出プロセスを信頼できないようにする可能性があります。
この課題に対処するために、最初に、テストデータを使用して、独立した同一に分散した(I.I.D)条件を満たすキャリブレーションデータを通じて検出モデルの実用的なパフォーマンスを評価します。
具体的には、各キャリブレーションサンプルの損失関数を定義して、リコール率や誤発見率の補体などの検出エラー率を定量化します。
その後、ユーザー定義のリスクレベルに基づいて統計的に厳密なしきい値を導き出し、テスト画像で高耐性の欠陥のあるピクセルを特定し、それにより予測セット(例:欠陥領域)を構築します。
この方法は、テストセットの予想されるエラー率(平均エラー率)が事前定義されたリスクレベルによって厳密にバウンスされたままであることを保証します。
さらに、平均予測セットサイズとテストセットのリスクレベルとの間に負の相関があり、検出モデルの不確実性を評価するための統計的に厳密なメトリックを確立します。
さらに、我々の研究では、さまざまなキャリブレーションとテストのパーティション比にわたる予想されるテストセットエラー率を堅牢かつ効率的に制御し、メソッドの適応性と運用効果を検証します。

要約(オリジナル)

In industrial settings, surface defects on steel can significantly compromise its service life and elevate potential safety risks. Traditional defect detection methods predominantly rely on manual inspection, which suffers from low efficiency and high costs. Although automated defect detection approaches based on Convolutional Neural Networks(e.g., Mask R-CNN) have advanced rapidly, their reliability remains challenged due to data annotation uncertainties during deep model training and overfitting issues. These limitations may lead to detection deviations when processing the given new test samples, rendering automated detection processes unreliable. To address this challenge, we first evaluate the detection model’s practical performance through calibration data that satisfies the independent and identically distributed (i.i.d) condition with test data. Specifically, we define a loss function for each calibration sample to quantify detection error rates, such as the complement of recall rate and false discovery rate. Subsequently, we derive a statistically rigorous threshold based on a user-defined risk level to identify high-probability defective pixels in test images, thereby constructing prediction sets (e.g., defect regions). This methodology ensures that the expected error rate (mean error rate) on the test set remains strictly bounced by the predefined risk level. Additionally, we observe a negative correlation between the average prediction set size and the risk level on the test set, establishing a statistically rigorous metric for assessing detection model uncertainty. Furthermore, our study demonstrates robust and efficient control over the expected test set error rate across varying calibration-to-test partitioning ratios, validating the method’s adaptability and operational effectiveness.

arxiv情報

著者 Cheng Shen,Yuewei Liu
発行日 2025-04-24 16:33:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Conformal Segmentation in Industrial Surface Defect Detection with Statistical Guarantees はコメントを受け付けていません

Towards Spatially-Lucid AI Classification in Non-Euclidean Space: An Application for MxIF Oncology Data

要約

さまざまな場所タイプからのマルチカテゴリポイントセットを考えると、私たちの目標は、ポイントの配置に基づいて2つのクラスを区別できる空間的にルシドな分類器を開発することです。
この問題は、腫瘍学などの多くのアプリケーションにとって、免疫腫瘍関係を分析し、新しい免疫療法を設計するために重要です。
空間的なばらつきと解釈可能性のニーズのために挑戦的です。
以前に提案されていた手法では、密なトレーニングデータが必要であるか、単一の場所タイプ内で大きな空間的変動を処理する能力が限られています。
最も重要なことは、これらの深いニューラルネットワーク(DNN)アプローチは、非ユークリッド空間、特にポイントセットで機能するように設計されていないことです。
既存の非ユークリッドDNNメソッドは、One-Size-Fits-Allアプローチに限定されています。
空間的に複雑な分類のためのさまざまな場所タイプで、加重距離学習率や空間ドメイン適応など、さまざまなトレーニング戦略を明示的に使用する空間アンサンブルフレームワークを探ります。
実際のデータセット(MXIF腫瘍学データなど)の実験結果は、提案されたフレームワークがベースライン方法よりも高い予測精度を提供することを示しています。

要約(オリジナル)

Given multi-category point sets from different place-types, our goal is to develop a spatially-lucid classifier that can distinguish between two classes based on the arrangements of their points. This problem is important for many applications, such as oncology, for analyzing immune-tumor relationships and designing new immunotherapies. It is challenging due to spatial variability and interpretability needs. Previously proposed techniques require dense training data or have limited ability to handle significant spatial variability within a single place-type. Most importantly, these deep neural network (DNN) approaches are not designed to work in non-Euclidean space, particularly point sets. Existing non-Euclidean DNN methods are limited to one-size-fits-all approaches. We explore a spatial ensemble framework that explicitly uses different training strategies, including weighted-distance learning rate and spatial domain adaptation, on various place-types for spatially-lucid classification. Experimental results on real-world datasets (e.g., MxIF oncology data) show that the proposed framework provides higher prediction accuracy than baseline methods.

arxiv情報

著者 Majid Farhadloo,Arun Sharma,Jayant Gupta,Alexey Leontovich,Svetomir N. Markovic,Shashi Shekhar
発行日 2025-04-24 16:45:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, eess.IV | Towards Spatially-Lucid AI Classification in Non-Euclidean Space: An Application for MxIF Oncology Data はコメントを受け付けていません

Revisiting Reset Mechanisms in Spiking Neural Networks for Sequential Modeling: Specialized Discretization for Binary Activated RNN

要約

画像認識の分野では、スパイクニューラルネットワーク(SNNS)は、従来の人工ニューラルネットワーク(ANN)に匹敵するパフォーマンスを達成しました。
このようなアプリケーションでは、SNNは基本的に量子化された活性化値を持つ従来のニューラルネットワークとして機能します。
この記事では、別の代替視点に焦点を当て、SNNをシーケンシャルモデリングタスクのバイナリ活性化再発性ニューラルネットワーク(RNNS)として見ています。この観点から、現在のSNNアーキテクチャはシーケンスモデリングのいくつかの基本的な課題に直面しています。
(2)SNNSの生物学的インスパイア成分(リセットメカニズムや耐火期間アプリケーションなど)は、シーケンスタスクの理論的には不足していないままです。
(3)SNNSのRNN様計算パラダイムは、さまざまなタイムステップ間の並行トレーニングを防ぎます。これらの課題に対処するために、この研究は、バイナリ活性化RNNベースのSNNシーケンスモデルのリセット操作と耐火期間の基本的なメカニズムの体系的な分析を実施します。
このような生物学的メカニズムが、スパーススパイキングパターンを生成するために厳密に必要であるかどうかを再検討し、新しい理論的説明と洞察を提供し、最終的にシーケンスモデリングのための固定抵抗性期間SNNアーキテクチャを提案します。

要約(オリジナル)

In the field of image recognition, spiking neural networks (SNNs) have achieved performance comparable to conventional artificial neural networks (ANNs). In such applications, SNNs essentially function as traditional neural networks with quantized activation values. This article focuses on an another alternative perspective,viewing SNNs as binary-activated recurrent neural networks (RNNs) for sequential modeling tasks.From this viewpoint, current SNN architectures face several fundamental challenges in sequence modeling: (1) Traditional models lack effective memory mechanisms for long-range sequence modeling; (2) The biological-inspired components in SNNs (such as reset mechanisms and refractory period applications) remain theoretically under-explored for sequence tasks; (3) The RNN-like computational paradigm in SNNs prevents parallel training across different timesteps.To address these challenges, this study conducts a systematic analysis of the fundamental mechanisms underlying reset operations and refractory periods in binary-activated RNN-based SNN sequence models. We re-examine whether such biological mechanisms are strictly necessary for generating sparse spiking patterns, provide new theoretical explanations and insights, and ultimately propose the fixed-refractory-period SNN architecture for sequence modeling.

arxiv情報

著者 Enqi Zhang
発行日 2025-04-24 17:09:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.NE | Revisiting Reset Mechanisms in Spiking Neural Networks for Sequential Modeling: Specialized Discretization for Binary Activated RNN はコメントを受け付けていません

Integrating Learning-Based Manipulation and Physics-Based Locomotion for Whole-Body Badminton Robot Control

要約

模倣学習(IL)や強化学習(RL)などの学習ベースの方法では、スポーツロボットなどの挑戦的なアジャイルロボットタスクをめぐるExcel制御ポリシーを作成できます。
ただし、トレーニングの複雑さを軽減し、アジャイルバドミントンロボット制御の安全性と安定性を確保するためのモデルベースの方法で学習ベースのポリシーを調和させた既存の作業はありません。
この論文では、アジャイルバドミントンロボットの新しいハイブリッド制御システムである\ ourmethodを紹介します。
具体的には、ARMポリシーのベースを提供するシャーシ移動のためのモデルベースの戦略を提案します。
学習ベースのARMポリシーのための物理学に基づいた「IL+RL」トレーニングフレームワークを紹介します。
この列車の枠組みでは、特権情報を備えたモデルベースの戦略を使用して、ILとRLの両方のフェーズでARMポリシートレーニングをガイドするために使用されます。
さらに、ILフェーズで批評家モデルを訓練して、ILからRLに移行するときのパフォーマンスドロップの問題を軽減します。
自己エンジニアリングのバドミントンロボットの結果を提示し、サービングマシンに対して94.5%の成功率を達成し、人間のプレーヤーに対する90.7%の成功率を達成しています。
私たちのシステムは、アジャイルキャッチングやテーブルテニスなど、他のアジャイルモバイル操作タスクに簡単に一般化できます。
当社のプロジェクトWebサイト:https://dreamstarring.github.io/hamlet/。

要約(オリジナル)

Learning-based methods, such as imitation learning (IL) and reinforcement learning (RL), can produce excel control policies over challenging agile robot tasks, such as sports robot. However, no existing work has harmonized learning-based policy with model-based methods to reduce training complexity and ensure the safety and stability for agile badminton robot control. In this paper, we introduce \ourmethod, a novel hybrid control system for agile badminton robots. Specifically, we propose a model-based strategy for chassis locomotion which provides a base for arm policy. We introduce a physics-informed “IL+RL” training framework for learning-based arm policy. In this train framework, a model-based strategy with privileged information is used to guide arm policy training during both IL and RL phases. In addition, we train the critic model during IL phase to alleviate the performance drop issue when transitioning from IL to RL. We present results on our self-engineered badminton robot, achieving 94.5% success rate against the serving machine and 90.7% success rate against human players. Our system can be easily generalized to other agile mobile manipulation tasks such as agile catching and table tennis. Our project website: https://dreamstarring.github.io/HAMLET/.

arxiv情報

著者 Haochen Wang,Zhiwei Shi,Chengxi Zhu,Yafei Qiao,Cheng Zhang,Fan Yang,Pengjie Ren,Lan Lu,Dong Xuan
発行日 2025-04-24 17:46:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO | Integrating Learning-Based Manipulation and Physics-Based Locomotion for Whole-Body Badminton Robot Control はコメントを受け付けていません