Range, not Independence, Drives Modularity in Biologically Inspired Representations

要約

なぜ生物学的および人工ニューロンが時々モジュール化され、それぞれが単一の意味のある変数をエンコードし、時には多くの変数の表現を巻き込むのですか?
この作業では、生物学的にインスパイアされたネットワーク(非陰性でエネルギー効率の高いネットワーク)が、ソース変数(ソース)の表現をモジュール化するときの理論を開発します。
生物学的にインスパイアされた最適な線形自動エンコーダーモジュラー化のニューロンがかどうかを判断するソースのサンプルに必要かつ十分な条件を導き出します。
私たちの理論は、以前の研究で研究された統計的独立性の場合をはるかに超えて、任意のデータセットに適用されます。
むしろ、サポートが「十分に広がっている」場合、ソースがモジュール化されていることを示します。
この理論から、データ分布が非線形フィードフォワードおよび再発性ニューラルネットワークのモジュール化にどのように影響するかについてのさまざまな経験的研究で予測を抽出および検証します。
さらに、これらのアイデアを神経科学データに適用し、範囲の独立性を使用して、一見矛盾する実験における偏見記録における空間記録と報酬情報の混合またはモジュラー化を理解できることを示しています。
さらに、これらの結果を使用して、柔軟な非線形分類の主な理論を超えて、混合選択性の代替起源を示唆しています。
要するに、私たちの理論は、神経活動がモジュール化される時期の正確な条件を規定しており、脳と機械のモジュラー表現を誘導および解明するためのツールを提供します。

要約(オリジナル)

Why do biological and artificial neurons sometimes modularise, each encoding a single meaningful variable, and sometimes entangle their representation of many variables? In this work, we develop a theory of when biologically inspired networks — those that are nonnegative and energy efficient — modularise their representation of source variables (sources). We derive necessary and sufficient conditions on a sample of sources that determine whether the neurons in an optimal biologically-inspired linear autoencoder modularise. Our theory applies to any dataset, extending far beyond the case of statistical independence studied in previous work. Rather we show that sources modularise if their support is “sufficiently spread”. From this theory, we extract and validate predictions in a variety of empirical studies on how data distribution affects modularisation in nonlinear feedforward and recurrent neural networks trained on supervised and unsupervised tasks. Furthermore, we apply these ideas to neuroscience data, showing that range independence can be used to understand the mixing or modularising of spatial and reward information in entorhinal recordings in seemingly conflicting experiments. Further, we use these results to suggest alternate origins of mixed-selectivity, beyond the predominant theory of flexible nonlinear classification. In sum, our theory prescribes precise conditions on when neural activities modularise, providing tools for inducing and elucidating modular representations in brains and machines.

arxiv情報

著者 Will Dorrell,Kyle Hsu,Luke Hollingsworth,Jin Hwa Lee,Jiajun Wu,Chelsea Finn,Peter E Latham,Tim EJ Behrens,James CR Whittington
発行日 2025-04-11 14:14:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.NE, q-bio.NC | Range, not Independence, Drives Modularity in Biologically Inspired Representations はコメントを受け付けていません

Meta-RTL: Reinforcement-Based Meta-Transfer Learning for Low-Resource Commonsense Reasoning

要約

Meta Learningは、低リソースのターゲットタスクのパフォーマンスを向上させるために、リソースソースタスクを活用するために広く使用されています。
残念ながら、ほとんどの既存のメタ学習アプローチは、知識転送のターゲットタスクとソースタスクの関連性を無視して、さまざまなソースタスクを等しく扱います。
この問題を軽減するために、低リソースのコモンセンス推論のための補強材ベースのマルチソースメタトランスファー学習フレームワーク(META-RTL)を提案します。
このフレームワークでは、メタ移動学習におけるターゲットタスクへの対応するタスクの寄与を測定するソースタスクの重みを動的に推定する強化ベースのアプローチを提示します。
サンプリングされたターゲットデータにおけるメタモデルの一般的な損失と、ソース固有の時間メタモデルのタスク固有の損失の違いは、報酬として強化学習モジュールのポリシーネットワークに供給されます。
ポリシーネットワークは、メタ学習イテレーション全体のソースタスク重量推定に長期的な依存関係をキャプチャするLSTMに基づいて構築されています。
BertとAlbertの両方を使用して、3つの常識的な推論ベンチマークデータセットのMetaモデルのバックボーンとして提案されたMeta-RTLを評価します。
実験結果は、Meta-RTLが強力なベースラインと以前のタスク選択戦略を大幅に上回り、非常に低いリソースの設定でより大きな改善を達成することを示しています。

要約(オリジナル)

Meta learning has been widely used to exploit rich-resource source tasks to improve the performance of low-resource target tasks. Unfortunately, most existing meta learning approaches treat different source tasks equally, ignoring the relatedness of source tasks to the target task in knowledge transfer. To mitigate this issue, we propose a reinforcement-based multi-source meta-transfer learning framework (Meta-RTL) for low-resource commonsense reasoning. In this framework, we present a reinforcement-based approach to dynamically estimating source task weights that measure the contribution of the corresponding tasks to the target task in the meta-transfer learning. The differences between the general loss of the meta model and task-specific losses of source-specific temporal meta models on sampled target data are fed into the policy network of the reinforcement learning module as rewards. The policy network is built upon LSTMs that capture long-term dependencies on source task weight estimation across meta learning iterations. We evaluate the proposed Meta-RTL using both BERT and ALBERT as the backbone of the meta model on three commonsense reasoning benchmark datasets. Experimental results demonstrate that Meta-RTL substantially outperforms strong baselines and previous task selection strategies and achieves larger improvements on extremely low-resource settings.

arxiv情報

著者 Yu Fu,Jie He,Yifan Yang,Qun Liu,Deyi Xiong
発行日 2025-04-11 14:38:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | Meta-RTL: Reinforcement-Based Meta-Transfer Learning for Low-Resource Commonsense Reasoning はコメントを受け付けていません

Ready, Bid, Go! On-Demand Delivery Using Fleets of Drones with Unknown, Heterogeneous Energy Storage Constraints

要約

無人航空機(UAV)は、物流を変革し、配送時間、コスト、排出量を削減することが期待されています。
この研究では、オンデマンドの配信に対処します。この配達では、uavの艦隊が展開されて、意地悪に到着する命令を満たすように展開されています。
以前の研究とは異なり、不均一で未知のエネルギー貯蔵能力を持つUAVを考慮し、エネルギー消費モデルの知識を想定していません。
オークションベースのタスクの割り当てとオンライン学習を組み合わせた分散型展開戦略を提案します。
各UAVは、エネルギー貯蔵電荷レベル、小包の質量、および配送距離に基づいて注文を入札するかどうかを独立して決定します。
時間が経つにつれて、能力の範囲内での注文のみを入札するというポリシーを改良します。
現実的なUAVエネルギーモデルを使用したシミュレーションは、直感的に、最も自信のない入札者に注文を割り当てると、配信時間が短縮され、成功した注文の数が増加することが明らかになります。
この戦略は、UAVが展開時に特定の充電レベルを超える必要があるしきい値ベースの方法を上回ることが示されています。
予測に学んだポリシーを使用する戦略のバリアントを提案します。
これにより、充電レベルが不十分なUAVは、特定の将来の時期に注文を満たすことを約束し、早期注文の優先順位を付けることができます。
私たちの仕事は、UAV群の長期展開に関する新しい洞察を提供し、現実世界の動的環境でのオンライン学習と組み合わされた分散型エネルギーを意識する意思決定の利点を強調しています。

要約(オリジナル)

Unmanned Aerial Vehicles (UAVs) are expected to transform logistics, reducing delivery time, costs, and emissions. This study addresses an on-demand delivery , in which fleets of UAVs are deployed to fulfil orders that arrive stochastically. Unlike previous work, it considers UAVs with heterogeneous, unknown energy storage capacities and assumes no knowledge of the energy consumption models. We propose a decentralised deployment strategy that combines auction-based task allocation with online learning. Each UAV independently decides whether to bid for orders based on its energy storage charge level, the parcel mass, and delivery distance. Over time, it refines its policy to bid only for orders within its capability. Simulations using realistic UAV energy models reveal that, counter-intuitively, assigning orders to the least confident bidders reduces delivery times and increases the number of successfully fulfilled orders. This strategy is shown to outperform threshold-based methods which require UAVs to exceed specific charge levels at deployment. We propose a variant of the strategy which uses learned policies for forecasting. This enables UAVs with insufficient charge levels to commit to fulfilling orders at specific future times, helping to prioritise early orders. Our work provides new insights into long-term deployment of UAV swarms, highlighting the advantages of decentralised energy-aware decision-making coupled with online learning in real-world dynamic environments.

arxiv情報

著者 Mohamed S. Talamali,Genki Miyauchi,Thomas Watteyne,Micael S. Couceiro,Roderich Gross
発行日 2025-04-11 14:39:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.MA, cs.RO | Ready, Bid, Go! On-Demand Delivery Using Fleets of Drones with Unknown, Heterogeneous Energy Storage Constraints はコメントを受け付けていません

MedHal: An Evaluation Dataset for Medical Hallucination Detection

要約

Medhalは、モデルが医療テキストの幻覚を検出できるかどうかを評価するために特別に設計された新しい大規模なデータセットです。
現在の幻覚検出方法は、医学のような特殊なドメインに適用されると、悲惨な結果をもたらす可能性がある場合に大きな制限に直面しています。
既存の医療データセットは小さすぎて、数百のサンプルしか含まれていないか、質問の回答や自然言語の推論などの単一のタスクに焦点を当てています。
Medhalは、これらのギャップに次のことで対処します。(1)多様な医療テキストソースとタスクを組み込む。
(2)医療幻覚検出モデルのトレーニングに適したかなりの量の注釈付きサンプルを提供する。
(3)モデル学習を導くための事実上の矛盾の説明を含む。
ベースラインの医療幻覚検出モデルをトレーニングおよび評価することにより、Medhalの有用性を実証し、汎用の幻覚検出アプローチに対する改善を示しています。
このリソースにより、医療テキスト生成システムのより効率的な評価が可能になり、費用のかかる専門家のレビューへの依存を減らし、医療AIの研究の開発を潜在的に加速させることができます。

要約(オリジナル)

We present MedHal, a novel large-scale dataset specifically designed to evaluate if models can detect hallucinations in medical texts. Current hallucination detection methods face significant limitations when applied to specialized domains like medicine, where they can have disastrous consequences. Existing medical datasets are either too small, containing only a few hundred samples, or focus on a single task like Question Answering or Natural Language Inference. MedHal addresses these gaps by: (1) incorporating diverse medical text sources and tasks; (2) providing a substantial volume of annotated samples suitable for training medical hallucination detection models; and (3) including explanations for factual inconsistencies to guide model learning. We demonstrate MedHal’s utility by training and evaluating a baseline medical hallucination detection model, showing improvements over general-purpose hallucination detection approaches. This resource enables more efficient evaluation of medical text generation systems while reducing reliance on costly expert review, potentially accelerating the development of medical AI research.

arxiv情報

著者 Gaya Mehenni,Amal Zouaq
発行日 2025-04-11 14:55:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, I.2.7 | MedHal: An Evaluation Dataset for Medical Hallucination Detection はコメントを受け付けていません

Malware analysis assisted by AI with R2AI

要約

この調査では、人工知能が支援するマルウェア分析の品質、速度、コストを研究しています。
2024-2025のLinuxおよびIoT Malwareに焦点を当て、Radare2の分解者のAI拡張であるR2AIを使用します。
すべてのマルウェアではなく、すべてのLLMが同等ではありませんが、この研究はClaude 3.5および3.7 Sonnetで優れた結果を示しています。
いくつかのエラーにもかかわらず、分析の品質は、AIの支援がないよりも全体的に等しく、またはそれ以上です。
良い結果のために、AIは単独で動作することはできず、経験豊富なアナリストに常に導かなければなりません。
AIの幻覚、誇張、不作為を理解する時間を考慮した場合でも、速度の向上はAIの支援でほとんど見えます。
通常、コストはマルウェアアナリストの給与よりも顕著に低くなりますが、AIが進捗を示さずに自然にループする場合に、それを制御するために注意とガイダンスが必要です。

要約(オリジナル)

This research studies the quality, speed and cost of malware analysis assisted by artificial intelligence. It focuses on Linux and IoT malware of 2024-2025, and uses r2ai, the AI extension of Radare2’s disassembler. Not all malware and not all LLMs are equivalent but the study shows excellent results with Claude 3.5 and 3.7 Sonnet. Despite a few errors, the quality of analysis is overall equal or better than without AI assistance. For good results, the AI cannot operate alone and must constantly be guided by an experienced analyst. The gain of speed is largely visible with AI assistance, even when taking account the time to understand AI’s hallucinations, exaggerations and omissions. The cost is usually noticeably lower than the salary of a malware analyst, but attention and guidance is needed to keep it under control in cases where the AI would naturally loop without showing progress.

arxiv情報

著者 Axelle Apvrille,Daniel Nakov
発行日 2025-04-11 15:06:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR | Malware analysis assisted by AI with R2AI はコメントを受け付けていません

Neural Fidelity Calibration for Informative Sim-to-Real Adaptation

要約

深い補強学習は、シミュレーターから現実世界にアジャイルな機動化とナビゲーションスキルをシームレスに転送できます。
ただし、ドメインのランダム化または敵対的な方法でSIMとリアルのギャップを埋めることは、多くの場合、政策の堅牢性を確保するために専門家の物理学知識を要求します。
それでも、最先端のシミュレーターは、すべての現実世界の詳細をキャプチャすることには及ばない可能性があり、再構築された環境は、さまざまな認識の不確実性のためにエラーを導入する可能性があります。
これらの課題に対処するために、ロボットの実行中にシミュレーターの物理係数とオンラインでの残留忠実度ドメインを調整するために条件付きスコアベースの拡散モデルを採用する新しいフレームワークであるニューラルフィデリティキャリブレーション(NFC)を提案します。
具体的には、残留忠実度は、実際のダイナミクスに対するシミュレーションモデルシフトを反映し、知覚された環境の不確実性をキャプチャし、政策微調整のために推定された分布の下で現実的な環境をサンプリングできるようにします。
私たちのフレームワークは、3つの重要な方法で有益で適応的です。(a)異常なシナリオの下でのみ前提条件のポリシーを微調整する、(b)拡散モデルのトレーニング負担を削減する前提条件のNFCの提案をオンラインでオンラインで構築し、(c)NFCの不確実性が高度化されたポリシー改善が促進された場合、(c)explaidemated explage explage explage exprientimped expriefimativt explage exprientimatipimatipimatipimativeが
私たちのフレームワークは、高次元パラメトリックスペースを備えた多様なロボット全体の最先端の方法と比較して、優れたシミュレーターのキャリブレーション精度を実現します。
シミュレーションと現実世界の実験における政策改善に対する残存の忠実度の重要な貢献を研究します。
特に、私たちのアプローチは、雪の多い表面の壊れたホイール車軸など、挑戦的な現実世界の条件下での堅牢なロボットナビゲーションを示しています。

要約(オリジナル)

Deep reinforcement learning can seamlessly transfer agile locomotion and navigation skills from the simulator to real world. However, bridging the sim-to-real gap with domain randomization or adversarial methods often demands expert physics knowledge to ensure policy robustness. Even so, cutting-edge simulators may fall short of capturing every real-world detail, and the reconstructed environment may introduce errors due to various perception uncertainties. To address these challenges, we propose Neural Fidelity Calibration (NFC), a novel framework that employs conditional score-based diffusion models to calibrate simulator physical coefficients and residual fidelity domains online during robot execution. Specifically, the residual fidelity reflects the simulation model shift relative to the real-world dynamics and captures the uncertainty of the perceived environment, enabling us to sample realistic environments under the inferred distribution for policy fine-tuning. Our framework is informative and adaptive in three key ways: (a) we fine-tune the pretrained policy only under anomalous scenarios, (b) we build sequential NFC online with the pretrained NFC’s proposal prior, reducing the diffusion model’s training burden, and (c) when NFC uncertainty is high and may degrade policy improvement, we leverage optimistic exploration to enable hallucinated policy optimization. Our framework achieves superior simulator calibration precision compared to state-of-the-art methods across diverse robots with high-dimensional parametric spaces. We study the critical contribution of residual fidelity to policy improvement in simulation and real-world experiments. Notably, our approach demonstrates robust robot navigation under challenging real-world conditions, such as a broken wheel axle on snowy surfaces.

arxiv情報

著者 Youwei Yu,Lantao Liu
発行日 2025-04-11 15:12:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY | Neural Fidelity Calibration for Informative Sim-to-Real Adaptation はコメントを受け付けていません

A Survey of Machine Learning Models and Datasets for the Multi-label Classification of Textual Hate Speech in English

要約

オンラインヘイトスピーチの普及は、個人、オンラインコミュニティ、および社会全体に深刻な否定的な結果をもたらす可能性があります。
これと大量の憎むべきオンラインコンテンツは、両方の開業医、つまり、コンテンツの節度や法執行機関、およびヘイトスピーチのインスタンスを自動的に分類する機械学習モデルに対する研究者の関心を促しました。
ほとんどの科学的作品は、ヘイトスピーチの分類にバイナリタスクとして対処しますが、実践では、例えば、ターゲット、重大度、または合法性に応じてサブタイプへの区別が必要であり、個々のコンテンツに重複する場合があります。
したがって、研究者は、マルチラベルの問題としてテキストデータのヘイトスピーチ分類にアプローチするデータセットと機械学習モデルを作成しました。
この研究は、英語のこの新たな研究景観に関する科学文献に関する最初の体系的かつ包括的な調査を提示します(n = 46)。
ラベルセット、サイズ、メタコンセプト、注釈プロセス、およびアノテーター間契約に関する重要な不均一性を明らかにするマルチラベル分類モデルのトレーニングに適した28のデータセットの簡潔な概要に貢献します。
適切な分類モデルを提案する24の出版物の分析は、評価における矛盾と、変圧器(BERT)および再発性ニューラルネットワーク(RNN)からの双方向エンコーダー表現に基づくアーキテクチャの好みをさらに確立します。
不均衡なトレーニングデータ、クラウドソーシングプラットフォームへの依存、小さくてまばらなデータセット、および方法論的アライメントの欠落を重要なオープンな問題として特定し、研究のための10の推奨事項を策定します。

要約(オリジナル)

The dissemination of online hate speech can have serious negative consequences for individuals, online communities, and entire societies. This and the large volume of hateful online content prompted both practitioners’, i.e., in content moderation or law enforcement, and researchers’ interest in machine learning models to automatically classify instances of hate speech. Whereas most scientific works address hate speech classification as a binary task, practice often requires a differentiation into sub-types, e.g., according to target, severity, or legality, which may overlap for individual content. Hence, researchers created datasets and machine learning models that approach hate speech classification in textual data as a multi-label problem. This work presents the first systematic and comprehensive survey of scientific literature on this emerging research landscape in English (N=46). We contribute with a concise overview of 28 datasets suited for training multi-label classification models that reveals significant heterogeneity regarding label-set, size, meta-concept, annotation process, and inter-annotator agreement. Our analysis of 24 publications proposing suitable classification models further establishes inconsistency in evaluation and a preference for architectures based on Bidirectional Encoder Representation from Transformers (BERT) and Recurrent Neural Networks (RNNs). We identify imbalanced training data, reliance on crowdsourcing platforms, small and sparse datasets, and missing methodological alignment as critical open issues and formulate ten recommendations for research.

arxiv情報

著者 Julian Bäumler,Louis Blöcher,Lars-Joel Frey,Xian Chen,Markus Bayer,Christian Reuter
発行日 2025-04-11 15:16:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | A Survey of Machine Learning Models and Datasets for the Multi-label Classification of Textual Hate Speech in English はコメントを受け付けていません

Enterprise-Grade Security for the Model Context Protocol (MCP): Frameworks and Mitigation Strategies

要約

人類によって導入されたモデルコンテキストプロトコル(MCP)は、外部データソースやツールとリアルタイムで対話するための人工知能(AI)システムの標準化されたフレームワークを提供します。
MCPはAIの統合と機能拡張に大きな利点を提供しますが、厳格な分析と緩和を要求する新しいセキュリティの課題を導入します。
このペーパーは、MCPアーキテクチャの基礎研究と予備セキュリティ評価に基づいて、エンタープライズグレードの緩和フレームワークと詳細な技術実装戦略を提供します。
MCP実装の体系的な脅威モデリングと分析を通じて、ツール中毒などの洗練された脅威を含む潜在的な攻撃ベクトルの分析により、MCP実装者と採用者に合わせた実用的なセキュリティパターンを提示します。
この研究の主な貢献は、理論的セキュリティの懸念を、実用的な制御を備えた実用的で実装可能なフレームワークに変換し、それにより、統合されたAIシステムの安全なエンタープライズの採用とガバナンスのための重要なガイダンスを提供することにあります。

要約(オリジナル)

The Model Context Protocol (MCP), introduced by Anthropic, provides a standardized framework for artificial intelligence (AI) systems to interact with external data sources and tools in real-time. While MCP offers significant advantages for AI integration and capability extension, it introduces novel security challenges that demand rigorous analysis and mitigation. This paper builds upon foundational research into MCP architecture and preliminary security assessments to deliver enterprise-grade mitigation frameworks and detailed technical implementation strategies. Through systematic threat modeling and analysis of MCP implementations and analysis of potential attack vectors, including sophisticated threats like tool poisoning, we present actionable security patterns tailored for MCP implementers and adopters. The primary contribution of this research lies in translating theoretical security concerns into a practical, implementable framework with actionable controls, thereby providing essential guidance for the secure enterprise adoption and governance of integrated AI systems.

arxiv情報

著者 Vineeth Sai Narajala,Idan Habler
発行日 2025-04-11 15:25:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR | Enterprise-Grade Security for the Model Context Protocol (MCP): Frameworks and Mitigation Strategies はコメントを受け付けていません

An Empirical Study of Conformal Prediction in LLM with ASP Scaffolds for Robust Reasoning

要約

この論文では、複雑なマルチステップ推論タスクで標準のオープンウェイトLLMSのパフォーマンスを強化するために、回答セットプログラミング(ASP)とともに、コンフォーマル言語モデリング(CLM)の使用を調べます。
空間的推論が必要なStepGameデータセットを使用して、LLMからASPプログラムのセットを生成するためにCLMを適用し、出力の正確性に関する統計的保証を提供します。
実験結果は、CLMが標準サンプリング方法を使用するベースラインモデルを大幅に上回り、異なるレベルの推論複雑さにわたって大幅な精度の改善を達成することを示しています。
さらに、LLM-As-Judgeメトリックは、特に構造的および論理的に正しいASP出力を評価する際に、CLMのパフォーマンスを向上させます。
ただし、多様なキャリブレーションセットを使用してCLMを較正すると、タスクの一般化性が改善されず、より長い推論ステップが必要であり、より複雑なタスクの処理の制限を示しています。

要約(オリジナル)

In this paper, we examine the use of Conformal Language Modelling (CLM) alongside Answer Set Programming (ASP) to enhance the performance of standard open-weight LLMs on complex multi-step reasoning tasks. Using the StepGame dataset, which requires spatial reasoning, we apply CLM to generate sets of ASP programs from an LLM, providing statistical guarantees on the correctness of the outputs. Experimental results show that CLM significantly outperforms baseline models that use standard sampling methods, achieving substantial accuracy improvements across different levels of reasoning complexity. Additionally, the LLM-as-Judge metric enhances CLM’s performance, especially in assessing structurally and logically correct ASP outputs. However, calibrating CLM with diverse calibration sets did not improve generalizability for tasks requiring much longer reasoning steps, indicating limitations in handling more complex tasks.

arxiv情報

著者 Navdeep Kaur,Lachlan McPheat,Alessandra Russo,Anthony G Cohn,Pranava Madhyastha
発行日 2025-04-11 15:33:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | An Empirical Study of Conformal Prediction in LLM with ASP Scaffolds for Robust Reasoning はコメントを受け付けていません

Deep Learning Methods for Detecting Thermal Runaway Events in Battery Production Lines

要約

バッテリー製造の重要な安全性の考慮事項の1つは、熱の暴走であり、温度の制御されていない上昇であり、火災、爆発、有毒ガスの排出につながる可能性があります。
そのため、このようなイベントを検出できる自動化されたシステムの開発は、学業と産業の両方のコンテキストで非常に重要です。
この作業では、オランダの自動車メーカーであるVDL Nedcarのバッテリー生産ラインで熱暴走を検出するための深い学習の使用を調査します。
具体的には、生産ラインからデータを収集して、ベースライン(非熱暴走)と熱暴走条件の両方を表します。
熱暴走は、外部熱と煙の源を使用することでシミュレートされました。
データは、光学画像とサーマル画像の両方で構成され、その後、モデルへの入力として機能する前に前処理および融合しました。
この点で、2つのパフォーマンスメトリック上の浅い畳み込みニューラルネットワーク、残留ニューラルネットワーク、視覚変圧器など、コンピュータービジョンで広く使用されている3つの深い学習モデルを評価しました。
さらに、説明可能性の方法を使用してこれらのモデルを評価して、入力から関連する機能情報をキャプチャする能力に関する洞察を得ました。
得られた結果は、深い学習の使用が、バッテリー生産ラインでの熱暴走検出に対する実行可能なアプローチであることを示しています。

要約(オリジナル)

One of the key safety considerations of battery manufacturing is thermal runaway, the uncontrolled increase in temperature which can lead to fires, explosions, and emissions of toxic gasses. As such, development of automated systems capable of detecting such events is of considerable importance in both academic and industrial contexts. In this work, we investigate the use of deep learning for detecting thermal runaway in the battery production line of VDL Nedcar, a Dutch automobile manufacturer. Specifically, we collect data from the production line to represent both baseline (non thermal runaway) and thermal runaway conditions. Thermal runaway was simulated through the use of external heat and smoke sources. The data consisted of both optical and thermal images which were then preprocessed and fused before serving as input to our models. In this regard, we evaluated three deep-learning models widely used in computer vision including shallow convolutional neural networks, residual neural networks, and vision transformers on two performance metrics. Furthermore, we evaluated these models using explainability methods to gain insight into their ability to capture the relevant feature information from their inputs. The obtained results indicate that the use of deep learning is a viable approach to thermal runaway detection in battery production lines.

arxiv情報

著者 Athanasios Athanasopoulos,Matúš Mihalák,Marcin Pietrasik
発行日 2025-04-11 15:35:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Deep Learning Methods for Detecting Thermal Runaway Events in Battery Production Lines はコメントを受け付けていません