المفاهيم الأساسية
의사들의 부담을 줄이기 위해 CT 영상의 자동평가를 위한 시각-언어 LLM의 능력을 평가하는 새로운 평가 프레임워크를 제안합니다.
الإحصائيات
"이러한 제한으로 인해 CT에 대한 동등한 자동 시스템이 현재 없습니다."
"이러한 점수는 의사로부터 얻은 것과 높은 상관관계를 보였습니다."
"GPT-4V는 평가에서 다른 모델들을 능가했습니다."
اقتباسات
"CT 슬라이스에 이상 소견을 포함한 CT 슬라이스를 입력하여 이상 소견의 예측 특성에 대한 자유 텍스트 요약을 생성합니다."
"GPT-4V는 우리의 평가에서 다른 모델들을 능가했지만 여전히 전반적인 개선이 필요합니다."