라벨이 GPT-4 영상의학인 게시물 표시

대형 언어 모델(LLM)은 영상의학과 진단의 미래인가? – 다기관 평가를 중심으로 본 가능성과 한계

이미지
 대형 언어 모델(LLM)은 영상의학과 진단의 미래인가? – 다기관 평가를 중심으로 본 가능성과 한계 서론 최근 ChatGPT를 포함한 대형 언어 모델(Large Language Models, 이하 LLM)이 의료 분야로 급속히 확장되고 있다. 특히 진단의 정확성과 속도가 생명과 직결되는 영상의학 분야 에서 LLM의 활용은 ‘혁신’이 아닌 ‘현실적 가능성’으로 다가오고 있다. 이에 대해 미국의 저명한 의학 저널인 NEJM AI 는 2024년 7월, 흥미로운 다기관 연구 결과를 발표했다 [1] . 이 연구는 GPT-4 기반 LLM이 실제 영상의학 임상 상황에서 의사결정에 얼마나 정확하고 유용한지를 종합적으로 분석한 최초의 대규모 다기관 평가로 주목받고 있다. 본 컬럼에서는 이 연구의 핵심 내용을 중심으로, LLM이 영상의학 진료에서 어떤 역할을 할 수 있으며 그 한계와 미래 전망은 어떤지를 세계적인 전문가 수준에서 심층적으로 분석한다. 본론 1. 대형 언어 모델(LLM)의 도입 배경 영상의학은 방대한 임상 정보, 방사선 이미지, 환자의 과거 병력, 검사 결과 등을 통합하여 판단해야 하는 고도의 전문 영역이다. 이 과정에서 발생하는 수많은 임상 의사결정 포인트는 AI, 특히 LLM의 자연어 처리 능력과 잘 맞아떨어진다. GPT-4와 같은 최신 모델은 의학 지식뿐만 아니라 맥락 이해력, 논리적 추론, 임상적 유사사례 기반 판단 능력을 모두 갖추고 있어, 임상 의사와 상호작용하거나 판단을 보조할 수 있는 가능성이 높다. 2. NEJM AI 다기관 연구의 개요 이번 연구 [1] 은 미국 5개 의료기관(Stanford, Massachusetts General, Duke 등)의 15명 이상 영상의학 전문의가 참여한 다기관 블라인드 평가 방식으로 진행되었다. 총 321건의 실제 환자 사례에 대해, GPT-4 기반 LLM이 임상 의사결정에 대해 내린 판단을 전문가의 평가와 비교하는 방식이었다. 평가 항목 은 다음과 같다. 적절한 영상의학 ...