Sybil: 폐암 조기 예측을 위한 딥러닝 기반 모델의 아시아 코호트 적용 가능성과 성능

 Sybil: 폐암 조기 예측을 위한 딥러닝 기반 모델의 아시아 코호트 적용 가능성과 성능

doi:10.1148/radiol.243393

서론

폐암은 전 세계적으로 암 관련 사망률 1위를 차지하는 질환으로, 조기 발견이 환자의 생존율을 결정짓는 핵심 요소로 여겨집니다. 

최근 의료 영상 분야에서 인공지능(AI) 기술의 발전은 폐암 조기 진단의 가능성을 획기적으로 향상시키고 있으며, 그 중심에는 딥러닝(Deep Learning, DL) 기반의 위험 예측 모델이 있습니다.

본 칼럼에서는 최근 Radiology 저널에 발표된 오픈소스 딥러닝 모델 Sybil의 아시아인 코호트에 대한 적용 가능성과 성능을 분석한 서울대병원 이종혁 교수팀의 연구 결과를 중심으로, Sybil 모델의 구조, 임상적 의미, 한계점 및 향후 과제를 심층적으로 분석합니다.


Sybil 모델이란?

Sybil은 저선량 흉부 CT(LDCT) 데이터를 기반으로 폐암 발생 위험을 6년 단위로 예측하는 오픈소스 딥러닝 모델입니다. 이 모델은 기존의 흡연력 기반 위험 평가 도구보다 더욱 정밀하고, 영상에서 감지 가능한 병변이 없어도 미래 발생 가능성을 예측하는 데 중점을 둡니다.

특히 Sybil은 영상에서 특징을 추출하고, 주목(attention) 맵을 생성하여 종양 가능성이 높은 영역에 집중함으로써 높은 예측 정확도를 보여줍니다.


연구 개요 및 방법론

이종혁 교수팀은 2004년부터 2021년까지 수집된 18,057명 아시아인 대상의 LDCT 데이터를 분석하여 Sybil 모델의 성능을 검증했습니다. 모든 대상자는 최소 1회의 추적 검사를 시행하였고, 총 92명(0.5%)이 6년 이내 폐암으로 진단되었습니다.

그림 1. Sybil 모델 예측 예시



오픈소스 딥러닝 모델인 Sybil이 폐암(기준선 CT에서 보이는 폐암)을 정확하게 예측하는 예. 

(A) 54세의 흡연 남성의 폐를 저선량 축 CT로 촬영한 영상에서 오른쪽 하엽에 1.5cm 크기의 준고형 결절이 보이며, 

(B) 주의 맵에서 이 부위에 초점을 맞추고 있음(화살표). Sybil 폐 위험 점수는 1년 위험의 경우 13.1%, 2년 위험의 경우 20.2%, 3년 위험의 경우 20.7%, 4년 위험의 경우 23.6%, 5년 위험의 경우 24.8%, 6년 위험의 경우 31.2%였음. 

(C) 2년 후의 축 CT 영상에서 준고형 결절이 2 cm로 커졌고, 이후 선암으로 진단된 것을 보여줌(화살표).  Sybil 폐 위험 점수는 저선량 흉부 CT 검사를 통해 6년 이내의 폐암 위험을 예측하는 딥 러닝 기반 위험 점수임.


주요 연구 결과

연구팀은 대상자를 흡연력에 따라 세 그룹으로 나누어 Sybil의 성능을 분석하였습니다:

표 1. Sybil 모델의 그룹별 ROC 곡선 하 면적(AUC)

그룹1년 AUC6년 AUC
전체 대상     0.91     0.74
20갑년 이상 흡연자     0.94 (가시적 병변)     0.70 (미래 발생)
비흡연자 및 경미 흡연자     0.89 (가시적 병변)     0.56 (미래 발생)

해석

  • 가시적 폐암의 경우, 전체적으로 매우 높은 예측 성능을 보였음 (AUC > 0.89)

  • 미래 발생 폐암에 대해서는 흡연자에서만 성능이 유의미하게 나타났으며, 비흡연자 그룹에서는 낮은 성능을 보였습니다.

  • 이는 Sybil 모델이 흡연력 기반의 위험 요소에 더 민감하게 반응하며, 현재는 영상 데이터 기반에서 유래한 특징들만을 고려하기 때문으로 해석됩니다.


임상적 의의

  • 아시아인 대상 최초의 대규모 외부 검증

    • 기존 미국 중심의 데이터와 달리, 아시아인의 CT 패턴 및 위험 요소에 대해 Sybil의 성능을 입증.

  • 추적 간격 최적화 가능성

    • 고위험군 환자에게 더 자주 CT를 시행하고, 저위험군은 검사 간격을 늘리는 방식으로 자원 효율화 가능.

  • 비흡연자에 대한 새로운 접근 필요

    • 비흡연 폐암의 비율이 높은 한국 등 동아시아 환경에서는 흡연력 외의 새로운 변수 도입이 필수적임.


기술적 해석: Sybil 모델의 딥러닝 구조

Sybil은 다음의 딥러닝 구조를 기반으로 작동합니다:

  1. 입력: 저선량 CT 영상

  2. CNN 기반 피처 추출기: 결절, 섬유화 등 미세한 구조 인식

  3. Attention 기반 리스크 예측기: 이상 병변 위치에 가중치를 부여

  4. 출력: 연차별 폐암 발생 위험 점수 (1년~6년)

이 구조는 완전 자동화가 가능하며, radiologist 개입 없이도 리스크 평가가 가능합니다.


Quiz

1. Sybil 모델이 높은 예측 성능을 보인 환자군은 다음 중 어디인가?

A. 비흡연자
B. 5갑년 이하 경미 흡연자
C. 20갑년 이상 흡연자
D. 폐암 병력이 있는 환자

2. 다음 중 Sybil 모델의 약점에 해당하는 것은?

A. 외부 테스트 필요성
B. CT 기반 위험 예측
C. 흡연력 반영
D. 폐암 예측 능력

정답 및 해설:

1. 정답: C, 해설: Sybil 모델은 20갑년 이상 흡연자군에서 6년 예측 AUC 0.70, 1년 예측 AUC 0.94로 가장 높은 성능을 보였습니다.

2. 정답: A, 해설: Sybil은 아직 외부 독립 코호트에서의 일반화 및 재현성 검증이 부족하므로 추가 연구가 필요합니다.


한계점 및 향후 과제

  • 비흡연 폐암에 대한 낮은 민감도: 아시아 국가에서는 비흡연 폐암이 높으므로 모델 확장이 필수.

  • 유전자, 환경, 직업력 등 비영상 기반 정보의 부족: AI에 더 다양한 입력값이 필요.

  • 임상 적용을 위한 규제 검토 및 투명성 확보 필요: AI 해석 가능성(interpretable AI)도 요구됨.


결론

Sybil은 흡연력을 가진 아시아인에 대해 폐암 예측에 높은 정확도를 보이는 혁신적인 딥러닝 모델입니다. 그러나 비흡연자, 다양한 인종 및 외부 데이터셋에서의 일반화 문제를 해결해야 진정한 임상 도입이 가능할 것입니다. 의료 AI의 미래를 예견하는 데 있어 Sybil은 강력한 출발점이 될 수 있습니다.


참고문헌

[1] J. H. Lee et al., "Open-source DL model does well for identifying lung cancer risk," Radiology, vol. 243, 2024. doi:10.1148/radiol.243393
[2] F. Jacobson and S. Byrne, “Commentary on Sybil: AI and nuanced care,” Radiology, 2024.
[3] Y. Hosny et al., "Artificial intelligence in radiology," Nature Reviews Cancer, vol. 18, no. 8, pp. 500–510, 2023.
[4] M. Ardila et al., "End-to-end lung cancer screening with three-dimensional deep learning on low-dose chest computed tomography," Nat Med, vol. 25, pp. 954–961, 2019.
[5] A. Esteva et al., "A guide to deep learning in healthcare," Nat Med, vol. 25, pp. 24–29, 2019.
[6] K. Suzuki, "Overview of deep learning in medical imaging," Computerized Medical Imaging and Graphics, vol. 79, 2020.
[7] T. Wang et al., "Interpretable AI for lung cancer risk prediction using LDCT," IEEE Trans Med Imaging, vol. 39, no. 8, pp. 2651–2661, 2022.

댓글

이 블로그의 인기 게시물

수면 건강 혁신: 기능성 직물 전도성 전극을 활용한 심전도 측정 기술의 최신 연구와 발전 방향

최첨단 진단 기술: 악성 포도막 흑색종 전이의 F-18 FDG PET/CT 조기 발견과 생존율 향상 전략

[유방암 영상의학] DCIS 업스테이징 예측을 위한 맘모그래피 기반 Radiomics: 최신 연구로 본 임상적 적용 가능성