LMV-RPA: Large Model Voting-based Robotic Process Automation

要約

大量の非構造化データ処理を自動化することは、運用効率に不可欠です。
光学文字認識(OCR)は重要ですが、多くの場合、複雑なレイアウトと曖昧なテキストの正確さと効率性に苦労しています。
これらの課題は、速度と精度の両方を必要とする大規模なタスクで特に顕著です。
このペーパーでは、OCRワークフローを強化するための大規模なモデル投票ベースのロボットプロセス自動化システムであるLMV-RPAを紹介します。
LMV-RPAは、Paddle OCR、Tesseract OCR、Easy OCR、Llama 3やGemini-1.5-Proなどの大規模な言語モデル(LLM)を備えたDoctrなどのOCRエンジンからの出力を統合します。
過半数の投票メカニズムを使用して、OCR出力を構造化されたJSON形式に処理し、特に複雑なレイアウトでの精度を向上させます。
多相パイプラインは、LLMSを介してOCRエンジンによって抽出されたテキストをプロセスし、結果を組み合わせて最も正確な出力を確保します。
LMV-RPAはOCRタスクで99%の精度を達成し、94%でベースラインモデルを上回り、処理時間を80%削減します。
ベンチマーク評価は、そのスケーラビリティを確認し、LMV-RPAが大規模なドキュメント処理タスクを自動化するためのより速く、より信頼性が高く、効率的なソリューションを提供することを示しています。

要約(オリジナル)

Automating high-volume unstructured data processing is essential for operational efficiency. Optical Character Recognition (OCR) is critical but often struggles with accuracy and efficiency in complex layouts and ambiguous text. These challenges are especially pronounced in large-scale tasks requiring both speed and precision. This paper introduces LMV-RPA, a Large Model Voting-based Robotic Process Automation system to enhance OCR workflows. LMV-RPA integrates outputs from OCR engines such as Paddle OCR, Tesseract OCR, Easy OCR, and DocTR with Large Language Models (LLMs) like LLaMA 3 and Gemini-1.5-pro. Using a majority voting mechanism, it processes OCR outputs into structured JSON formats, improving accuracy, particularly in complex layouts. The multi-phase pipeline processes text extracted by OCR engines through LLMs, combining results to ensure the most accurate outputs. LMV-RPA achieves 99 percent accuracy in OCR tasks, surpassing baseline models with 94 percent, while reducing processing time by 80 percent. Benchmark evaluations confirm its scalability and demonstrate that LMV-RPA offers a faster, more reliable, and efficient solution for automating large-scale document processing tasks.

arxiv情報

著者 Osama Abdellatif,Ahmed Ayman,Ali Hamdi
発行日 2025-04-28 15:54:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, cs.SE パーマリンク