AI 기반 전이학습 모델을 활용한 만성부비동염 수술 후 예후 분석
AI 기반 전이학습 모델을 활용한 만성부비동염 수술 후 예후 분석
doi: 10.1186/s12938-025-01428-y
서론
만성부비동염(Chronic
Rhinosinusitis, CRS)은 전 세계적으로 ENT 진료에서 매우 흔한 질환으로, 중국에서는 약 8%의 유병률을 보여 1억 명 이상이 영향을 받고 있습니다. 약물치료에 반응하지 않는 환자들은
기능적 내시경 부비동 수술(Endoscopic Sinus Surgery, ESS)을 받게 되며, 수술 후 3~6개월 동안의 관리가 장기 예후에 매우 중요합니다. 그러나 수술 후 내시경 평가의 높은 주관성과 환자의 낮은 추적관리 순응도는 예후 평가의 일관성과 질 높은 질병
관리를 어렵게 만듭니다.
이에 본 연구에서는 사전학습된 대형 비전 모델(pre-trained foundation models)을
기반으로 전이학습을 적용한 AI 모델을 통해 수술 후 내시경 영상에서 환자의 상태를 정량적으로 분류하는
체계를 개발하고자 하였습니다.
연구 목적 및 방법 요약
본 연구는 Fudan University 및 Zhongshan Hospital의 2개 기관에서 다기관 후향적 방식으로 시행되었습니다. 총 2,000장의 수술 후 내시경 영상이 수집되어 전문가 2인의 판독을
거쳐 "용종(polyp)", "부종(edema)", "정상(smooth)" 세
가지 상태로 분류되었습니다.
전이학습에 사용된 모델은 다음과 같습니다:
·
CLIP: 일반 비전
데이터셋 기반
·
MedSAM: 다양한
의료 이미지 기반
·
Endo-FM: 내시경
전용 데이터셋 기반
기본 네트워크는 ViT-B/32 (Vision Transformer)이며, 비교군으로 ResNet-50도 사용되었습니다.
| Figure 1. CRS 수술 후 결과 모델의 구조 |
결과 요약
AI 모델의 분류 성능은 다음과 같습니다:
Smooth
vs. 나머지 조건(edema + polyp):
·
정확도: 91.17%
·
AUC: 0.97
·
민감도: 91.85%
·
특이도: 86.35%
Polyp
vs. 나머지 조건(smooth + edema):
·
정확도: 81.87%
·
AUC: 0.90
·
민감도: 81.04%
·
특이도: 80.53%
Endo-FM 기반 ViT 모델이 가장 우수한 성능을
보였으며, 기존 랜덤 초기화 기반 모델 대비 약 4~15% 향상된
정확도를 보여주었습니다.
| Figure 2. 다양한 모델별 분류 정확도 및 ROC 곡선. (a~e: ResNet-Scratch, ViT-Scratch, ViT-CLIP, ViT-MedSAM, ViT-EndoFM) |
| Figure 3. a-e 스크래치에서 학습된 ResNet 및 ViT, 그리고 전이 학습을 위한 사전 학습된 기반 모델로 CLIP, MedSAM 및 Endo-FM을 활용하는 ViT 모델에 대한 테스트 세트 정확도의 3가지 클래스 혼동 행렬을 보여줍니다. |
의의 및 임상적 활용
이번 연구는 CRS의 수술 후 경과 관리를 보다 표준화하고 재현 가능성 높은 방식으로 수행할 수 있도록 인공지능을 도입한 점에서
의미가 큽니다. 특히 다음과 같은 점에서 임상적으로 유의미한 가능성을 제시합니다:
1.
주관성을 제거한 정량적 예후 평가 가능
2.
홈유즈 내시경과의 결합을 통한 비대면 원격 진료 가능성
3.
적은 학습 데이터로도 높은 성능 확보 (데이터
부족 극복)
향후에는 더 많은 내시경 영상 데이터셋 확보를 통해 CRS 특이적인 대형 사전학습 모델을 구축하면
더욱 정밀한 진단 보조 시스템으로 발전할 수 있습니다.
결론
전이학습 기반 AI 모델은 만성부비동염 수술 후 내시경 영상을 기반으로 높은 정확도의 예후 예측을 가능하게 하였으며, 향후 재택 진료 시스템 구축과 정밀 의료 구현에 핵심 도구로 활용될 수 있을 것입니다.
참고문헌
[1] A. Krizhevsky, I. Sutskever and G. Hinton, "Imagenet
classification with deep convolutional neural networks," Communications of the ACM,
vol. 60, pp. 84-90, 2017.
[2] D. Ardila et al., "End-to-end lung cancer
screening with three-dimensional deep learning on low-dose chest computed
tomography," Nature
Medicine, vol. 25, pp. 954-961, 2019.
[3] S. Cai et al., "Using a deep learning system in
endoscopy for screening of early esophageal squamous cell carcinoma," Gastrointestinal Endoscopy,
vol. 90, pp. 745-753.e2, 2019.
[4] D. Lin et al., "Application of comprehensive
artificial intelligence retinal expert (CARE) system," Lancet Digital Health,
vol. 3, e486-e495, 2021.
[5] B. Girdler et al., "Feasibility of a deep
learning-based algorithm for automated detection and classification of nasal
polyps and inverted papillomas," Int Forum Allergy Rhinol., vol. 11, pp.
1637–1646, 2021.
[6] Z. Wang et al., "Foundation Model for Endoscopy
Video Analysis via Large-scale Self-supervised Pre-train," arXiv preprint,
arXiv:2306.16741, 2024.
[7] A. Radford et al., "Learning Transferable Visual Models From Natural Language Supervision," arXiv preprint, arXiv:2103.00020, 2021.
댓글
댓글 쓰기