核心概念
大規模言語モデルの豊富な知識を活用し、医療知識グラフを統合することで、より詳細で臨床的に有用な放射線レポートを自動生成する。
摘要
本研究は、大規模言語モデル(LLM)の強力な能力を活用し、医療知識グラフを統合することで、自動放射線レポート生成(R2Gen)の性能を向上させる新しいフレームワークKARGENを提案している。
主な特徴は以下の通り:
-
LLMの豊富な知識を活用しつつ、医療知識グラフを統合することで、特定のタスクであるR2Genに関連する知識を効果的に引き出す。これは従来の手法と比べて大きな改善をもたらす。
-
画像特徴と疾患関連特徴を統合する2つの融合手法を提案し、通常所見と異常所見の両方を適切に捉えることができる。
-
提案手法は、MIMIC-CXRおよびIU-Xrayデータセットにおいて、従来手法を大きく上回る性能を示す。特に、臨床関連指標であるRadGraph F1、BERTScore、RadCliQで最高スコアを達成し、医療現場での有用性が高いことが確認された。
统计
放射線画像から抽出した領域特徴と、医療知識グラフを活用して抽出した疾患関連特徴を統合することで、より詳細で臨床的に有用な放射線レポートを生成できる。
提案手法は、MIMIC-CXRデータセットでBLEU-4スコアが0.140、ROUGE-Lスコアが0.305、METEOR スコアが0.165、CIDErスコアが0.289を達成した。
IU-Xrayデータセットでは、BLEU-4スコアが0.180、ROUGE-Lスコアが0.385、METEOR スコアが0.218、CIDErスコアが0.491を達成した。
臨床関連指標では、MIMIC-CXRデータセットでRadGraph F1が0.203、BERTScoreが0.421、RadCliQが1.165を記録した。
引用
"大規模言語モデルの豊富な知識を活用しつつ、医療知識グラフを統合することで、特定のタスクであるR2Genに関連する知識を効果的に引き出すことができる。"
"画像特徴と疾患関連特徴を統合する2つの融合手法を提案し、通常所見と異常所見の両方を適切に捉えることができる。"
"提案手法は、MIMIC-CXRおよびIU-Xrayデータセットにおいて、従来手法を大きく上回る性能を示し、特に臨床関連指標で最高スコアを達成した。"