Fine-Grained and Multi-Dimensional Metrics for Document-Level Machine Translation

要約

大規模な言語モデル(LLMS)は、機械翻訳(MT)を含むさまざまなNLPタスクで優れていますが、ほとんどの研究は文レベルの翻訳に焦点を当てています。
この作業では、ドキュメントレベルの翻訳(Docmt)の命令チューニングLLMの固有の能力を調査します。
専門的な手法を必要とする以前のアプローチとは異なり、LLMSを1回のパスでドキュメント全体を翻訳するように直接促すことで評価します。
私たちの結果は、この方法が、ドキュメントレベルの微調整がなくても、個別に翻訳文と比較して翻訳の品質を改善することを示しています。
ただし、この利点はBLEUスコアには反映されておらず、多くの場合、文ベースの翻訳を支持しています。
GPT-4を使用して、N-GRAMベースのメトリックよりも微妙な方法でドキュメントの一貫性、精度、および流encyさを評価するために、LLM-A-A-A-Judgeパラダイムを使用することを提案します。
全体として、私たちの仕事は、命令チューニングされたLLMが翻訳のためにドキュメントコンテキストを効果的に活用できることを示しています。
ただし、Docmtを評価するためにBLEUスコアを使用することに対して注意してください。誤解を招く結果を提供することが多く、ドキュメントレベルの翻訳の品質をキャプチャできないからです。
gpt4-as-a-judgeからのコードと出力は、https://github.com/eit-nlp/bleuless_docmtで入手できます。

要約(オリジナル)

Large language models (LLMs) have excelled in various NLP tasks, including machine translation (MT), yet most studies focus on sentence-level translation. This work investigates the inherent capability of instruction-tuned LLMs for document-level translation (docMT). Unlike prior approaches that require specialized techniques, we evaluate LLMs by directly prompting them to translate entire documents in a single pass. Our results show that this method improves translation quality compared to translating sentences separately, even without document-level fine-tuning. However, this advantage is not reflected in BLEU scores, which often favor sentence-based translations. We propose using the LLM-as-a-judge paradigm for evaluation, where GPT-4 is used to assess document coherence, accuracy, and fluency in a more nuanced way than n-gram-based metrics. Overall, our work demonstrates that instruction-tuned LLMs can effectively leverage document context for translation. However, we caution against using BLEU scores for evaluating docMT, as they often provide misleading outcomes, failing to capture the quality of document-level translation. Code and the outputs from GPT4-as-a-judge are available at https://github.com/EIT-NLP/BLEUless_DocMT

arxiv情報

著者 Yirong Sun,Dawei Zhu,Yanjun Chen,Erjia Xiao,Xinghao Chen,Xiaoyu Shen
発行日 2025-03-14 13:12:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | Fine-Grained and Multi-Dimensional Metrics for Document-Level Machine Translation はコメントを受け付けていません

Annotating Scientific Uncertainty: A comprehensive model using linguistic patterns and comparison with existing approaches

要約

科学的な完全なテキストの科学的不確実性を検出するように設計されたシステムであるUnsciNtify。
このシステムは、弱く監視された手法を利用して、科学テキストとその著者の参照における口頭で表現された不確実性を特定します。
unscientifyのコア方法論は、スパンパターンマッチング、複雑な文分析、および著者の参照チェックを統合する多面的なパイプラインに基づいています。
このアプローチは、科学的不確実性を特定するために不可欠なラベル付けと注釈のプロセスを合理化し、情報の検索、テキスト採掘、科学文書処理などの多様なアプリケーションをサポートするために、さまざまな不確実性表現タイプをカバーします。
評価結果は、最新の大手言語モデル(LLMS)とUnsciNtifyシステム間のトレードオフを強調しています。
より伝統的な手法を採用しているUnsciNtifyは、科学的不確実性検出タスクで優れたパフォーマンスを達成し、0.808の精度スコアを達成しました。
この発見は、この特定のアプリケーションのUnscientifyの単純なルールベースとパターンマッチング戦略の継続的な関連性と効率を強調しています。
結果は、リソースの効率、解釈性、ドメイン固有の適応性が重要であるシナリオでは、従来の方法が依然として大きな利点を提供できることを示しています。

要約(オリジナル)

UnScientify, a system designed to detect scientific uncertainty in scholarly full text. The system utilizes a weakly supervised technique to identify verbally expressed uncertainty in scientific texts and their authorial references. The core methodology of UnScientify is based on a multi-faceted pipeline that integrates span pattern matching, complex sentence analysis and author reference checking. This approach streamlines the labeling and annotation processes essential for identifying scientific uncertainty, covering a variety of uncertainty expression types to support diverse applications including information retrieval, text mining and scientific document processing. The evaluation results highlight the trade-offs between modern large language models (LLMs) and the UnScientify system. UnScientify, which employs more traditional techniques, achieved superior performance in the scientific uncertainty detection task, attaining an accuracy score of 0.808. This finding underscores the continued relevance and efficiency of UnScientify’s simple rule-based and pattern matching strategy for this specific application. The results demonstrate that in scenarios where resource efficiency, interpretability, and domain-specific adaptability are critical, traditional methods can still offer significant advantages.

arxiv情報

著者 Panggih Kusuma Ningrum,Philipp Mayr,Nina Smirnova,Iana Atanassova
発行日 2025-03-14 13:21:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.DL | Annotating Scientific Uncertainty: A comprehensive model using linguistic patterns and comparison with existing approaches はコメントを受け付けていません

Optimizing Large Language Models for Detecting Symptoms of Comorbid Depression or Anxiety in Chronic Diseases: Insights from Patient Messages

要約

糖尿病の患者は、うつ病や不安のリスクが高く、管理を複雑にしています。
この研究では、安全な患者メッセージからこれらの症状を検出する際の大規模な言語モデル(LLM)のパフォーマンスを評価しました。
エンジニアリングプロンプト、体系的なペルソナ、温度調整、ゼロショットおよび少数のショット学習など、複数のアプローチを適用して、最適なモデルを特定し、パフォーマンスを向上させました。
5つのLLMのうち3つが優れたパフォーマンス(F-1と精度の90%以上)を示し、LLAMA 3.1 405BはF-1とゼロショットアプローチを使用して精度の両方で93%を達成しました。
LLMSは、患者の健康アンケート-4などの複雑なメトリックのバイナリ分類と取り扱いにおいて有望を示しましたが、挑戦的な場合の矛盾は、さらなる現実の評価を必要とします。
この調査結果は、LLMSがタイムリーなスクリーニングと紹介を支援する可能性を強調し、慢性疾患の患者のメンタルヘルスケアを改善できる現実世界のトリアージシステムの貴重な経験的知識を提供します。

要約(オリジナル)

Patients with diabetes are at increased risk of comorbid depression or anxiety, complicating their management. This study evaluated the performance of large language models (LLMs) in detecting these symptoms from secure patient messages. We applied multiple approaches, including engineered prompts, systemic persona, temperature adjustments, and zero-shot and few-shot learning, to identify the best-performing model and enhance performance. Three out of five LLMs demonstrated excellent performance (over 90% of F-1 and accuracy), with Llama 3.1 405B achieving 93% in both F-1 and accuracy using a zero-shot approach. While LLMs showed promise in binary classification and handling complex metrics like Patient Health Questionnaire-4, inconsistencies in challenging cases warrant further real-life assessment. The findings highlight the potential of LLMs to assist in timely screening and referrals, providing valuable empirical knowledge for real-world triage systems that could improve mental health care for patients with chronic diseases.

arxiv情報

著者 Jiyeong Kim,Stephen P. Ma,Michael L. Chen,Isaac R. Galatzer-Levy,John Torous,Peter J. van Roessel,Christopher Sharp,Michael A. Pfeffer,Carolyn I. Rodriguez,Eleni Linos,Jonathan H. Chen
発行日 2025-03-14 13:27:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | Optimizing Large Language Models for Detecting Symptoms of Comorbid Depression or Anxiety in Chronic Diseases: Insights from Patient Messages はコメントを受け付けていません

Emergent Abilities in Large Language Models: A Survey

要約

大規模な言語モデル(LLM)は、人工的な一般情報に向けた最も有望な研究の流れの1つとして、新しい技術革命をリードしています。
これらのモデルのスケーリングは、パラメーターの数とトレーニングデータセットの大きさを増やすことで達成され、以前は観察されていなかったさまざまないわゆる緊急能力にリンクされています。
高度な推論やコンテスト内の学習からコーディングや問題解決に至るまでのこれらの緊急能力は、激しい科学的議論を引き起こしました。それらは本当に緊急ですか、それとも単にトレーニングダイナミクス、問題の種類、選択したメトリックなどの外部要因に依存していますか?
どのような根本的なメカニズムがそれらを引き起こしますか?
それらの変革的可能性にもかかわらず、緊急の能力は依然として不十分に理解されており、その定義、性質、予測可能性、および意味についての誤解につながります。
この作業では、現象の包括的なレビューを実施することにより、緊急の能力に光を当て、その科学的基盤と現実世界の結果の両方に対処しました。
最初に、既存の定義を批判的に分析し、緊急能力を概念化する際の矛盾を明らかにします。
次に、これらの能力が現れる条件を調査し、スケーリング法則、タスクの複雑さ、トレーニング前の損失、量子化、および促す戦略の役割を評価します。
私たちのレビューは、従来のLLMを超えて拡張されており、強化学習と推論時間検索を活用して推論と自己反省を増幅する大きな推論モデル(LRM)が含まれています。
ただし、出現は本質的にポジティブではありません。
AIシステムは自律的な推論能力を獲得するにつれて、欺ception、操作、報酬ハッキングなどの有害な行動も開発します。
安全性とガバナンスに関する懸念の高まりを強調し、より良い評価フレームワークと規制上の監視の必要性を強調します。

要約(オリジナル)

Large Language Models (LLMs) are leading a new technological revolution as one of the most promising research streams toward artificial general intelligence. The scaling of these models, accomplished by increasing the number of parameters and the magnitude of the training datasets, has been linked to various so-called emergent abilities that were previously unobserved. These emergent abilities, ranging from advanced reasoning and in-context learning to coding and problem-solving, have sparked an intense scientific debate: Are they truly emergent, or do they simply depend on external factors, such as training dynamics, the type of problems, or the chosen metric? What underlying mechanism causes them? Despite their transformative potential, emergent abilities remain poorly understood, leading to misconceptions about their definition, nature, predictability, and implications. In this work, we shed light on emergent abilities by conducting a comprehensive review of the phenomenon, addressing both its scientific underpinnings and real-world consequences. We first critically analyze existing definitions, exposing inconsistencies in conceptualizing emergent abilities. We then explore the conditions under which these abilities appear, evaluating the role of scaling laws, task complexity, pre-training loss, quantization, and prompting strategies. Our review extends beyond traditional LLMs and includes Large Reasoning Models (LRMs), which leverage reinforcement learning and inference-time search to amplify reasoning and self-reflection. However, emergence is not inherently positive. As AI systems gain autonomous reasoning capabilities, they also develop harmful behaviors, including deception, manipulation, and reward hacking. We highlight growing concerns about safety and governance, emphasizing the need for better evaluation frameworks and regulatory oversight.

arxiv情報

著者 Leonardo Berti,Flavio Giorgi,Gjergji Kasneci
発行日 2025-03-14 13:28:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG | Emergent Abilities in Large Language Models: A Survey はコメントを受け付けていません

Hierarchical Information-Guided Spatio-Temporal Mamba for Stock Time Series Forecasting

要約

Mambaは、優れた選択メカニズムにより、さまざまな時系列予測タスクで優れたパフォーマンスを実証しています。
それにもかかわらず、従来のマンバベースのモデルは、包括的な市場のダイナミクスと個々の株式間の複雑な相互依存関係の両方を適切にキャプチャできないため、在庫時系列を正確に予測する際に重要な課題に遭遇します。
これらの制約を克服するために、階層的な情報誘導空間時代のマンバ(HIGSTM)フレームワークを紹介します。
HIGSTMは、時系列から共通性と特異性を抽出するために、インデックスガイドの周波数フィルタリング分解を導入します。
モデルアーキテクチャは、株式市場内で時間的な動的パターンとグローバルな静的関係の両方を体系的にキャプチャする細心の注意を払って設計された階層的なフレームワークを特徴としています。
さらに、マクロの情報をシーケンス選択プロセスに統合する情報誘導MAMBAを提案し、それにより、より多くの市場に敏感な意思決定を促進します。
CSI500、CSI800、およびCSI1000データセットで実施された包括的な実験評価は、HIGSTMが最新のパフォーマンスを達成することを示しています。

要約(オリジナル)

Mamba has demonstrated excellent performance in various time series forecasting tasks due to its superior selection mechanism. Nevertheless, conventional Mamba-based models encounter significant challenges in accurately predicting stock time series, as they fail to adequately capture both the overarching market dynamics and the intricate interdependencies among individual stocks. To overcome these constraints, we introduce the Hierarchical Information-Guided Spatio-Temporal Mamba (HIGSTM) framework. HIGSTM introduces Index-Guided Frequency Filtering Decomposition to extract commonality and specificity from time series. The model architecture features a meticulously designed hierarchical framework that systematically captures both temporal dynamic patterns and global static relationships within the stock market. Furthermore, we propose an Information-Guided Mamba that integrates macro informations into the sequence selection process, thereby facilitating more market-conscious decision-making. Comprehensive experimental evaluations conducted on the CSI500, CSI800 and CSI1000 datasets demonstrate that HIGSTM achieves state-of-the-art performance.

arxiv情報

著者 Wenbo Yan,Shurui Wang,Ying Tan
発行日 2025-03-14 13:30:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Hierarchical Information-Guided Spatio-Temporal Mamba for Stock Time Series Forecasting はコメントを受け付けていません

Reproducible Machine Learning-based Voice Pathology Detection: Introducing the Pitch Difference Feature

要約

目的:公開されているSaarbr \ ‘ucken Voiceデータベース(SVD)を使用した音声病理検出の新しい方法論と、一般的に使用される音響操作機能と2つの新しいものを組み合わせた堅牢な機能セットを紹介します。
方法:6つの機械学習(ML)アルゴリズムを評価します – ベクターマシン、K-ナイアスベイズ、ナイーブベイズ、意思決定ツリー、ランダムフォレスト、およびアダボースト – 実現可能なハイパーパラメーターと20480の異なる機能サブセットのグリッド検索を使用します。
トップ1000分類モデル – 各MLアルゴリズムの特徴サブセットの組み合わせは、繰り返し層分析された交差検証で検証されます。
クラスの不均衡に対処するために、K-Means Smoteを適用してトレーニングデータを増やします。
結果:私たちのアプローチは、女性、男性、および複合結果の85.61%、84.69%、および85.22%の非加重平均リコール(UAR)をそれぞれ達成します。
不均衡なデータの高度に偏ったメトリックであるため、精度を意図的に省略します。
結論:我々の研究は、提案された方法論と機能エンジニアリングに従って、母音 /a: /の持続的な発話である最も単純なボーカルタスクに適用されるMLモデルを使用して、さまざまな音声病理の検出に可能性があることを示しています。
方法論を容易に使用し、主張をサポートするために、DOI 10.5281/Zenodo.13771573で公開されているGitHubリポジトリを提供します。
最後に、読みやすさ、再現性、および私たちのアプローチの正当化を強化するための改革チェックリストを提供します

要約(オリジナル)

Purpose: We introduce a novel methodology for voice pathology detection using the publicly available Saarbr\’ucken Voice Database (SVD) and a robust feature set combining commonly used acoustic handcrafted features with two novel ones: pitch difference (relative variation in fundamental frequency) and NaN feature (failed fundamental frequency estimation). Methods: We evaluate six machine learning (ML) algorithms — support vector machine, k-nearest neighbors, naive Bayes, decision tree, random forest, and AdaBoost — using grid search for feasible hyperparameters and 20480 different feature subsets. Top 1000 classification models — feature subset combinations for each ML algorithm are validated with repeated stratified cross-validation. To address class imbalance, we apply K-Means SMOTE to augment the training data. Results: Our approach achieves 85.61%, 84.69% and 85.22% unweighted average recall (UAR) for females, males and combined results respectively. We intentionally omit accuracy as it is a highly biased metric for imbalanced data. Conclusion: Our study demonstrates that by following the proposed methodology and feature engineering, there is a potential in detection of various voice pathologies using ML models applied to the simplest vocal task, a sustained utterance of the vowel /a:/. To enable easier use of our methodology and to support our claims, we provide a publicly available GitHub repository with DOI 10.5281/zenodo.13771573. Finally, we provide a REFORMS checklist to enhance readability, reproducibility and justification of our approach

arxiv情報

著者 Jan Vrba,Jakub Steinbach,Tomáš Jirsa,Laura Verde,Roberta De Fazio,Yuwen Zeng,Kei Ichiji,Lukáš Hájek,Zuzana Sedláková,Zuzana Urbániová,Martin Chovanec,Jan Mareš,Noriyasu Homma
発行日 2025-03-14 13:47:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | Reproducible Machine Learning-based Voice Pathology Detection: Introducing the Pitch Difference Feature はコメントを受け付けていません

A Neural Network Architecture Based on Attention Gate Mechanism for 3D Magnetotelluric Forward Modeling

要約

有限要素法(FEM)や有限体積法(FVM)などの従来の3次元磁気伸筋(MT)数値順方向モデリング法は、メッシュの洗練と計算リソースの制限により、高い計算コストと低い効率に悩まされています。
3D MTフォワードモデリングの注意ゲーティングメカニズムを統合するMtagu-Netという名前の新しいニューラルネットワークアーキテクチャを提案します。
具体的には、デュアルパスの注意ゲーティングモジュールは、フォワード応答データ画像に基づいて設計され、エンコーダーとデコーダーの間のスキップ接続に埋め込まれています。
このモジュールにより、ディープフィーチャマップのデコード中に浅い機能マップからの重要な異常情報の融合が可能になり、異常な領域から特徴を抽出するネットワークの機能が大幅に向上します。
さらに、3Dガウスランダムフィールド(GRF)を使用した合成モデル生成方法を導入し、現実世界の地質学的シナリオの電気構造を高い忠実度で正確に複製します。
数値実験は、Mtagu-netが収束安定性と予測精度の観点から従来の3D U-Netを上回ることを示しており、順方向応答データの構造類似性指数(SSIM)は常に0.98を超えています。
さらに、ネットワークは、以前に見えないデータセットモデルのフォワード応答データを正確に予測でき、その強力な一般化能力を実証し、実際のアプリケーションでこのメソッドの実現可能性と有効性を検証します。

要約(オリジナル)

Traditional three-dimensional magnetotelluric (MT) numerical forward modeling methods, such as the finite element method (FEM) and finite volume method (FVM), suffer from high computational costs and low efficiency due to limitations in mesh refinement and computational resources. We propose a novel neural network architecture named MTAGU-Net, which integrates an attention gating mechanism for 3D MT forward modeling. Specifically, a dual-path attention gating module is designed based on forward response data images and embedded in the skip connections between the encoder and decoder. This module enables the fusion of critical anomaly information from shallow feature maps during the decoding of deep feature maps, significantly enhancing the network’s capability to extract features from anomalous regions. Furthermore, we introduce a synthetic model generation method utilizing 3D Gaussian random field (GRF), which accurately replicates the electrical structures of real-world geological scenarios with high fidelity. Numerical experiments demonstrate that MTAGU-Net outperforms conventional 3D U-Net in terms of convergence stability and prediction accuracy, with the structural similarity index (SSIM) of the forward response data consistently exceeding 0.98. Moreover, the network can accurately predict forward response data on previously unseen datasets models, demonstrating its strong generalization ability and validating the feasibility and effectiveness of this method in practical applications.

arxiv情報

著者 Xin Zhong,Weiwei Ling,Kejia Pan,Pinxia Wu,Jiajing Zhang,Zhiliang Zhan,Wenbo Xiao
発行日 2025-03-14 13:48:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | A Neural Network Architecture Based on Attention Gate Mechanism for 3D Magnetotelluric Forward Modeling はコメントを受け付けていません

From Generative AI to Innovative AI: An Evolutionary Roadmap

要約

このホワイトペーパーでは、生成人工知能(GENAI)から革新的な人工知能(INAI)への重要な移行について説明します。
Genaiでの最近の進歩により、システムはさまざまなドメインで高品質のコンテンツを生成することができましたが、これらのモデルは真のイノベーションの能力を欠いていることがよくあります。
これに関連して、イノベーションは、学習データの単なる複製を超える斬新で有用な出力を生成する能力として定義されます。
この論文は、このシフトを調べ、コンテンツを生成し、自律的な問題解決と創造的なアイデアに従事するAIシステムを開発するためのロードマップを提案します。
この作業は、AIを真に革新し、科学、技術、芸術に有意義に貢献できる段階にAIを進めるための理論的洞察と実用的な戦略の両方を提供します。

要約(オリジナル)

This paper explores the critical transition from Generative Artificial Intelligence (GenAI) to Innovative Artificial Intelligence (InAI). While recent advancements in GenAI have enabled systems to produce high-quality content across various domains, these models often lack the capacity for true innovation. In this context, innovation is defined as the ability to generate novel and useful outputs that go beyond mere replication of learned data. The paper examines this shift and proposes a roadmap for developing AI systems that can generate content and engage in autonomous problem-solving and creative ideation. The work provides both theoretical insights and practical strategies for advancing AI to a stage where it can genuinely innovate, contributing meaningfully to science, technology, and the arts.

arxiv情報

著者 Seyed Mahmoud Sajjadi Mohammadabadi
発行日 2025-03-14 14:03:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | From Generative AI to Innovative AI: An Evolutionary Roadmap はコメントを受け付けていません

Combining Causal Models for More Accurate Abstractions of Neural Networks

要約

機械的解釈は、実装する高レベルのアルゴリズムを明らかにすることにより、ニューラルネットワークをリバースエンジニアリングすることを目的としています。
因果抽象化は、ネットワークがアルゴリズムを実装するときの正確な概念を提供します。つまり、ネットワークの因果モデルには、アルゴリズムの因果モデルの高レベルの変数を実現する低レベルの機能が含まれています。
実際の設定における典型的な問題は、アルゴリズムがネットワークの完全に忠実な抽象化ではないことです。つまり、モデルの真の推論プロセスを部分的にキャプチャすることです。
さまざまな単純な高レベルモデルを組み合わせて、ネットワークのより忠実な表現を生成するソリューションを提案します。
この組み合わせを学習することで、ニューラルネットワークを、提供された入力に応じて異なる計算状態にあるようにモデル化できます。
解釈可能性仮説の強さのトレードオフを観察します。これは、高レベルモデルによって説明される入力の数と、交換介入の精度として定義する忠実さの数とその忠実さの観点から見られます。
私たちの方法により、2つの間で変調することができ、忠実なレベルを与えられたニューラルネットワークの動作を説明するモデルの最も正確な組み合わせを提供します。

要約(オリジナル)

Mechanistic interpretability aims to reverse engineer neural networks by uncovering which high-level algorithms they implement. Causal abstraction provides a precise notion of when a network implements an algorithm, i.e., a causal model of the network contains low-level features that realize the high-level variables in a causal model of the algorithm. A typical problem in practical settings is that the algorithm is not an entirely faithful abstraction of the network, meaning it only partially captures the true reasoning process of a model. We propose a solution where we combine different simple high-level models to produce a more faithful representation of the network. Through learning this combination, we can model neural networks as being in different computational states depending on the input provided, which we show is more accurate to GPT 2-small fine-tuned on two toy tasks. We observe a trade-off between the strength of an interpretability hypothesis, which we define in terms of the number of inputs explained by the high-level models, and its faithfulness, which we define as the interchange intervention accuracy. Our method allows us to modulate between the two, providing the most accurate combination of models that describe the behavior of a neural network given a faithfulness level.

arxiv情報

著者 Theodora-Mara Pîslar,Sara Magliacane,Atticus Geiger
発行日 2025-03-14 14:14:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Combining Causal Models for More Accurate Abstractions of Neural Networks はコメントを受け付けていません

Adaptive Torque Control of Exoskeletons under Spasticity Conditions via Reinforcement Learning

要約

痙縮は、脳性麻痺、遺伝性痙性対麻痺、脊髄損傷、脳卒中の個人における一般的な運動障害の症状であり、これらの疾患の進行で最も障害のある特徴の1つです。
ウェアラブルロボットを使用して痙縮を治療する潜在的な利点にもかかわらず、修正されたアシュワーススケールで$ {1^+} $を超えるレベルの痙縮のある被験者には現在、それらの使用は推奨されていません。
この速度依存性の強壮剤反射のさまざまなダイナミクスにより、安全なパーソナライズコントローラーの展開が困難になります。
ここでは、タスクのパフォーマンスと相互作用力の削減を説明する関節の痙縮条件下での膝の外骨格のディープ補強学習(RL)を介した新しい適応トルクコントローラーについて説明します。
RLエージェントを訓練するために、関節の不整合と筋肉の活性化のための微分可能な痙攣性反射モデルを備えた筋骨格 – エキソスケレトンシステムを含むデジタルツインを開発しました。
シミュレートされた膝伸展運動の結果は、エージェントが異なるレベルの痙縮のある個人の外骨格を制御することを学ぶことを示しました。
提案されたコントローラーは、痙性条件下で人間の関節に平均10.6 \%で適用された最大トルクを減らし、従来の準拠コントローラーと比較して沈降時間を8.9 \%まで減少させることができました。

要約(オリジナル)

Spasticity is a common movement disorder symptom in individuals with cerebral palsy, hereditary spastic paraplegia, spinal cord injury and stroke, being one of the most disabling features in the progression of these diseases. Despite the potential benefit of using wearable robots to treat spasticity, their use is not currently recommended to subjects with a level of spasticity above ${1^+}$ on the Modified Ashworth Scale. The varying dynamics of this velocity-dependent tonic stretch reflex make it difficult to deploy safe personalized controllers. Here, we describe a novel adaptive torque controller via deep reinforcement learning (RL) for a knee exoskeleton under joint spasticity conditions, which accounts for task performance and interaction forces reduction. To train the RL agent, we developed a digital twin, including a musculoskeletal-exoskeleton system with joint misalignment and a differentiable spastic reflexes model for the muscles activation. Results for a simulated knee extension movement showed that the agent learns to control the exoskeleton for individuals with different levels of spasticity. The proposed controller was able to reduce maximum torques applied to the human joint under spastic conditions by an average of 10.6\% and decreases the root mean square until the settling time by 8.9\% compared to a conventional compliant controller.

arxiv情報

著者 Andrés Chavarrías,David Rodriguez-Cianca,Pablo Lanillos
発行日 2025-03-14 14:22:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY | Adaptive Torque Control of Exoskeletons under Spasticity Conditions via Reinforcement Learning はコメントを受け付けていません