라벨이 응급영상추천인 게시물 표시

AI 기반 응급 영상의 검토: LLM과 ACR 지침의 조화

이미지
  AI 기반 응급 영상의 검토: LLM과 ACR 지침의 조화 doi:10.1038/s43856-025-01061-9 서론: 의료 AI와 응급 영상의 중요성 응급실에서 신속하고 정확한 영상의학 검사 선택은 질환 진단의 핵심입니다. 하지만 임상의들 간에도 검사 선택은 크게 다를 수 있으며, 이는 환자의 방사선 노출, 진료 효율, 의료 비용 측면에서 큰 과제입니다. 본 논문은 RadCases 데이터셋 과 ACR Appropriateness Criteria (ACR AC) 지침을 활용하여, 대형 언어 모델(LLM)이 임상 상황에 따라 적절한 영상 검사를 제안하는 시스템을 개발하고 검증한 최초의 연구입니다. 데이터와 방법: RadCases와 증거 기반 파이프라인 RadCases 데이터셋 : 1500개 이상의 실제 환자 한 줄 요약("one-liner")을 ACR AC 주제별 레이블로 정리  기저 모델 평가 : Claude Sonnet-3.5 등 LLM이 주어진 one-liner에 대해 직접 영상 검사를 추천하는 방식은 ACR과 일치하지 않는 경우가 많았고, 과잉 또는 누락 오류도 존재함  증거 기반 추론 파이프라인 : LLM으로 ACR 주제(Topic)를 예측한 뒤, ACR AC에서 해당 주제에 적합한 영상을 찾아 추천하는 방식 도입으로 정확도 및 신뢰도 향상 그림 설명 그림 1.  Large Language Models Struggle with Diagnostic Imaging Ordering. – Claude Sonnet-3.5 모델이 진단 영상 검사 추천에서 ACR 지침과 어긋나는 경우가 흔하고, 불필요하거나 부적절한 검사를 추천하거나 필요한 검사를 누락함을 시각화. 그림 2–3.  Topic Accuracy 및 Imaging Accuracy 정의 및 최적화 전략(RAG, ICL, COT, MFT)의 효과 비교.\ – RAG(검색 강화 생성), ICL(문맥 내 학습), COT(사고의 흐름 유...