Med42-v2: A Suite of Clinical LLMs

要約

Med42-v2 では、医療現場における汎用モデルの制限に対処するために設計された一連の臨床大規模言語モデル (LLM) が導入されています。
これらのモデルは Llama3 アーキテクチャに基づいて構築され、特殊な臨床データを使用して微調整されています。
彼らは、自然なプロンプトに効果的に反応するために、多段階の好みの調整を受けました。
ジェネリック モデルは予防措置として臨床質問への回答を避けるように優先的に調整されることが多いですが、Med42-v2 はこの制限を克服するように特別にトレーニングされており、臨床現場での使用を可能にしています。
Med42-v2 モデルは、8B および 70B パラメータ構成および GPT-4 の両方で、さまざまな医療ベンチマークにわたって、元の Llama3 モデルと比較して優れたパフォーマンスを示します。
これらの LLM は、臨床クエリを理解し、推論タスクを実行し、臨床環境で貴重な支援を提供するために開発されています。
モデルは現在、\href{https://huggingface.co/m42-health}{https://huggingface.co/m42-health} で公開されています。

要約(オリジナル)

Med42-v2 introduces a suite of clinical large language models (LLMs) designed to address the limitations of generic models in healthcare settings. These models are built on Llama3 architecture and fine-tuned using specialized clinical data. They underwent multi-stage preference alignment to effectively respond to natural prompts. While generic models are often preference-aligned to avoid answering clinical queries as a precaution, Med42-v2 is specifically trained to overcome this limitation, enabling its use in clinical settings. Med42-v2 models demonstrate superior performance compared to the original Llama3 models in both 8B and 70B parameter configurations and GPT-4 across various medical benchmarks. These LLMs are developed to understand clinical queries, perform reasoning tasks, and provide valuable assistance in clinical environments. The models are now publicly available at \href{https://huggingface.co/m42-health}{https://huggingface.co/m42-health}.

arxiv情報

著者 Clément Christophe,Praveen K Kanithi,Tathagata Raha,Shadab Khan,Marco AF Pimentel
発行日 2024-08-12 13:37:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク