要約
このレポートは、神経学のドメイン固有の言語モデルの開発と評価を文書化しています。
当初、オーダーメイドモデルの構築に焦点を当てていたプロジェクトは、オープンソースと商業医療LLMの急速な進歩に適応し、検索された高級世代(RAG)と安全なローカル展開の代表モデルを活用することにシフトしました。
主な貢献には、神経学固有のデータセット(ケースレポート、QAセット、教科書由来データ)の作成、マルチワード発現抽出のためのツール、および医療用語のグラフベースの分析が含まれます。
このプロジェクトでは、ローカルホスティング用のスクリプトとDockerコンテナも作成しました。
パフォーマンスメトリックとグラフコミュニティの結果が報告されており、PHI-4などのオープンソースアーキテクチャを使用したマルチモーダルモデルの将来の可能な作業が開かれています。
要約(オリジナル)
This report documents the development and evaluation of domain-specific language models for neurology. Initially focused on building a bespoke model, the project adapted to rapid advances in open-source and commercial medical LLMs, shifting toward leveraging retrieval-augmented generation (RAG) and representational models for secure, local deployment. Key contributions include the creation of neurology-specific datasets (case reports, QA sets, textbook-derived data), tools for multi-word expression extraction, and graph-based analyses of medical terminology. The project also produced scripts and Docker containers for local hosting. Performance metrics and graph community results are reported, with future possible work open for multimodal models using open-source architectures like phi-4.
arxiv情報
著者 | Henry Watkins |
発行日 | 2025-06-06 16:14:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google