要約
法的文書作成を自動化することで、効率を大幅に向上させ、手作業を減らし、法的ワークフローを合理化することができる。先行研究では、判決予測や判例要約などのタスクが研究されているが、インドの法的領域における私的な法的文書の構造化生成は、ほとんど未解決のままである。このギャップを埋めるために、我々はVidhikDastaavejを紹介する。VidhikDastaavejは匿名化された新しい私的法律文書のデータセットであり、NyayaShilpはインドの法律文書に特別に適応した微調整された法律文書生成モデルである。まず構造化されたセクションタイトルを生成し、次に検索ベースのメカニズムを活用して一貫性と事実の正確性を確保しながらコンテンツを反復的に生成する2段階のフレームワークであるModel-Agnostic Wrapper (MAW)を提案する。我々は、インストラクションチューニングされたバージョンやドメインアダプテッドバージョンを含む複数のオープンソースLLMを、プロプライエタリモデルと比較するためにベンチマークした。その結果、小さなデータセットで直接微調整を行っても必ずしも改善されるとは限らないが、我々の構造化ラッパーは、幻覚を軽減しながら、一貫性、事実の順守、文書全体の品質を大幅に向上させることがわかった。実世界での適用性を確保するため、我々はHITL(Human-in-the-Loop)文書生成システムを開発した。HITLは、ユーザが文書の種類を指定し、セクションの詳細を絞り込み、構造化された法律草案を生成することを可能にする対話型ユーザインタフェースである。このツールにより、法律の専門家や研究者は、AIが生成した法律文書を効率的に生成、検証、改良することができます。専門家の評価を含む広範な評価により、我々のフレームワークが構造化された法的ドラフティングにおいて高い信頼性を達成することが確認された。本研究は、インドにおけるAI支援による法的ドラフティングのためのスケーラブルで適応可能な基盤を確立し、構造化された法的文書生成への効果的なアプローチを提供する。
要約(オリジナル)
Automating legal document drafting can significantly enhance efficiency, reduce manual effort, and streamline legal workflows. While prior research has explored tasks such as judgment prediction and case summarization, the structured generation of private legal documents in the Indian legal domain remains largely unaddressed. To bridge this gap, we introduce VidhikDastaavej, a novel, anonymized dataset of private legal documents, and develop NyayaShilp, a fine-tuned legal document generation model specifically adapted to Indian legal texts. We propose a Model-Agnostic Wrapper (MAW), a two-step framework that first generates structured section titles and then iteratively produces content while leveraging retrieval-based mechanisms to ensure coherence and factual accuracy. We benchmark multiple open-source LLMs, including instruction-tuned and domain-adapted versions, alongside proprietary models for comparison. Our findings indicate that while direct fine-tuning on small datasets does not always yield improvements, our structured wrapper significantly enhances coherence, factual adherence, and overall document quality while mitigating hallucinations. To ensure real-world applicability, we developed a Human-in-the-Loop (HITL) Document Generation System, an interactive user interface that enables users to specify document types, refine section details, and generate structured legal drafts. This tool allows legal professionals and researchers to generate, validate, and refine AI-generated legal documents efficiently. Extensive evaluations, including expert assessments, confirm that our framework achieves high reliability in structured legal drafting. This research establishes a scalable and adaptable foundation for AI-assisted legal drafting in India, offering an effective approach to structured legal document generation.
arxiv情報
著者 | Shubham Kumar Nigam,Balaramamahanthi Deepak Patnaik,Ajay Varghese Thomas,Noel Shallum,Kripabandhu Ghosh,Arnab Bhattacharya |
発行日 | 2025-04-04 14:41:50+00:00 |
arxivサイト | arxiv_id(pdf) |