라디오믹스 기반 MRI 반자동 선택 바이오마커: 직장암 수술 위험도 예측의 혁신적 접근

https://dx.doi.org/10.9718/JBER.2023.44.1.11

직장암은 세계적으로 남녀 모두에게서 번째로 높은 발병 빈도를 보이는 암종입니다. 특히 직장이 좁은 골반강 내에 위치하여 수술 난이도가 매우 높아, 수술 해부학적 구조와 종양의 특성을 정확히 이해하는 것이 환자의 치료 방침 결정에 필수적입니다. 이러한 이유로 자기공명영상(MRI) 검사는 직장암의 병기 결정 수술 난이도 예측에 핵심적인 역할을 수행하고 있습니다.

그러나 기존의 직장암 수술 위험도 예측 연구는 외과 전문의의 임상적 경험에 크게 의존하여 MRI 영상 슬라이스를 수동으로 선택하는 방식이었으며, 이는 많은 시간과 노력을 필요로 뿐만 아니라, 전문가의 주관적 판단에 따른 재현성 문제와 한계를 내포하고 있었습니다.

컬럼에서는 이러한 한계를 극복하고 직장암 수술 위험도 예측 연구의 효율성을 높일 있는 라디오믹스 기반 MRI 반자동 선택 바이오마커 검증 연구에 대해 세계적인 전문가 수준의 지식으로 심층 분석하고자 합니다. 특히, 인공지능(AI) 디지털 영상처리 기법을 활용하여 외과 전문의가 선택한 MRI 영상 슬라이스와 슬라이스의 정량적 특징 차이를 분석하고, 수술 위험도 예측에 유의미한 새로운 바이오마커를 발굴하는 혁신적인 접근법을 소개합니다.


라디오믹스(Radiomics) 인공지능(AI) 기반 정량적 분석의 중요성

라디오믹스(Radiomics) 의료 영상, 특히 MRI 같은 디지털 영상에서 사람의 눈으로 감지하기 어려운 다양한 정량적 특징(Quantitative Features) 통계적, 수학적 추출을 통해 얻어내는 기법입니다. 이러한 정량적 특징들은 종양의 이질성(Heterogeneity) 질감, 모양 정보를 정량화하여 이미지 해석에 있어 외과 전문의의 주관적인 경험의 한계를 극복할 있는 가능성을 제시합니다.

최근에는 디지털 영상처리 기법(DIP) 기계 학습(ML) 결합된 컴퓨터 보조 진단(CAD) 기법이 외과 전문의의 진단을 보조하기 위해 활발히 연구되고 있습니다. 직장암 수술 위험도 예측에서도 라디오믹스를 통해 추출된 특징들을 기반으로 인공지능 모델을 학습시키고, 결과를 설명할 있는 정량적 생체지표(Biomarker) 선정하는 연구가 중요해지고 있습니다.

연구의 핵심 목적은 직장암 수술 위험도 예측 연구에서 외과 전문의의 수동적인 슬라이스 선택 과정이 지니는 재현성 문제를 개선하고, 반자동으로 선택된 2D MRI 영상 슬라이스를 분류하기 위한 정량적 바이오마커를 검증하는 것입니다. 이는 궁극적으로 의사결정 속도를 높이고 연구의 효율성을 향상시키는 기여할 있습니다.


연구 방법론: 데이터 수집 특징 추출 과정

연구에서는 가천대학교 길병원에서 2017 1월부터 2020 12월까지 직장암으로 복강경 수술을 받은 환자 50명의 2차원 MRI Axial 영상 데이터를 후향적으로 수집했습니다. , 외과 전문의가 선택한 중간 직장 MRI 영상 50장과 외의 중간 직장 MRI 영상 50장을 선별하여 100장의 데이터를 사용했습니다.

1. 데이터 전처리 관심 영역(ROI) 설정

  • ROI 레이블링: 전문의 검수 과정을 거쳐 Coreline Soft Aview 프로그램을 사용하여 종양에 대한 관심 영역(ROI) 표시했습니다.
  • 이미지 변환: 라디오믹스 특징 추출을 위해 MRI 영상을 그레이스케일로 변환하고, 수동으로 표시된 ROI 마스크 이미지로 변환했습니다.
  • 크기 표준화: 가로, 세로 비율이 다른 영상 데이터의 크기를 조정하기 위해 Zero Padding 방식을 이용하여 모든 이미지를 256 X 256 픽셀 변환했습니다.

그림 1. MRI 영상 슬라이스 데이터 처리 결과

  • (a) 원본: 직장암 MRI 영상 슬라이스의 원본 이미지.
  • (b) 관심 영역 이미지: 원본 이미지에 외과 전문의가 표시한 직장암 종양의 관심 영역(ROI) 초록색으로 표시된 이미지.
  • (c) 마스크 이미지: 특징 추출에 사용하기 위해 ROI 흰색으로, 배경을 검은색으로 변환한 마스크 이미지.

2. 라디오믹스 기반 특징 추출

파이썬 기반 오픈소스 패키지인 PyRadiomics 사용하여 외과 전문의가 선택한 직장암 MRI 영상의 특징을 정량적인 수치로 표현했습니다.

102개의 특징 추출되었으며, 이는 다음 7가지 범주로 구성됩니다:

  • 1 히스토그램 통계 (First Order): 18 (평균, 분산 )
  • 형질 특징 (2D Shape): 9
  • GLCM (Gray Level Co-occurrence Matrix): 24 (대비, 에너지, 동질성 )
  • GLDM (Gray Level Dependence Matrix): 14
  • GLRLM (Gray Level Run Length Matrix): 16
  • GLSZM (Gray Level Size Zone Matrix): 16
  • NGTDM (Neighborhood Gray Tone Difference Matrix): 5 (거칠기, 대비, 혼잡도 )

3. 특징 선택 학습 모델 구축

모델의 학습 시간을 단축하고 분류 성능을 높이기 위해 유의미한 특징을 선택하는 과정이 필수적입니다.

  • 특징 선택 기법 (4가지): LASSO, Ridge regularization (Ridge), Recursive Feature Elimination (RFE), Sequential Feature Selector (SFS).
  • 분류 모델 (4가지): Random Forest (RF), Extreme Gradient Boosting (XGB), Logistic Regression (LR), Support Vector Machine (SVM).

4가지 분류기와 4가지 특징 선택 기법을 조합하여 16가지 접근 방식으로 모델을 학습 분류하여 성능을 평가했습니다.


그림 2. 라디오믹스를 통한 직장암 MRI 영상 슬라이스 선택 분류 연구 흐름도

  • (a) ROI Segmentation: 외과 전문의가 선택한(Select) 이미지와 외의(Non-select) 이미지에 대해 ROI 분할하는 과정.
  • (b) Feature Extraction: Intensity(강도), 2D Shape(형태), Texture(질감) 같은 라디오믹스 특징을 추출하는 과정.
  • (c) Feature Selection: LASSO, Ridge, SFS, RFE 등의 방법을 사용하여 특징 중요도를 분석하고 선택하는 과정.
  • (d) Model Validation: 선택된 특징으로 RF, LR, SVM, XGB 모델을 학습하고 민감도(Sensitivity), 특이도(Specificity), 정확도(Accuracy), AUC 등의 지표로 모델을 검증하고, 특징 차이 분석을 수행하는 과정.

연구 결과: 최적의 조합과 성능 평가

16가지 조합의 분류 성능을 확인한 결과, Random Forest (RF) 분류기와 Ridge 특징 선택 기법의 조합 가장 우수한 성능을 보였습니다.

1. 조합별 분류 성능 (AUC 기준)


그림 3. MRI 영상 슬라이스 선택 분류 성능을 확인하기 위한 성능 평가 분석 결과

  • 제시된 수치는 분류 성능의 AUC (Area Under the Curve) 값입니다.
  • RF + Ridge 조합이 0.89 가장 높은 AUC 값을 기록했습니다.
  • SVM + LASSO 조합은 0.61 상대적으로 낮은 성능을 보였습니다.

2. RF 분류기 조합의 상세 성능 지표

테스트 데이터 50건을 사용하여 RF 분류기와 특징 선택 방법의 조합에 대한 재현율, 특이도, 정밀도, AUC 값을 상세히 분석했습니다.

1. RF Ridge, LASSO, SFS, RFE 조합의 재현율, 특이도, 정밀도, AUC 분석결과

Recall (재현율)

Specificity (특이도)

Precision (정밀도)

AUC

RF + Ridge

0.83

0.88

0.85

0.89+- 0.09

RF+LASSO

0.82

0.66

0.83

0.86+- 0.12

RF+SFS

0.85

0.73

0.86

0.88+- 0.11

RF+RFE

0.84

0.75

0.87

0.88+- 0.08$

  • RF + Ridge 조합이 재현율 0.83, 특이도 0.88, 정밀도 0.85, AUC 0.89 +-0.09 가장 높은 성능 다시 한번 입증했습니다. 이는 Ridge 기법이 변수 상관관계가 높은 상황에서도 모든 독립변수를 보존하여 좋은 예측 성능을 가져왔기 때문으로 분석됩니다.
  • 반면, RF + LASSO 조합은 특이도 0.66, AUC 0.86 +- 0.12 가장 낮은 성능을 보였는데, 이는 LASSO 기법이 변수 하나만 채택하는 과정에서 정보 손실이 발생하여 정확도가 떨어진 것으로 판단됩니다.

핵심 바이오마커: 상위 5 특징의 발굴

가장 우수한 성능을 보인 RF Ridge 조합에서 직장암 MRI 영상 슬라이스 선택 분류에 유의미한 상위 5개의 특징 중요도 값을 분석했습니다. 특징들은 라디오믹스 기반 직장암 수술 위험도 예측의 핵심 바이오마커로 활용될 잠재력을 지니고 있습니다.

1. 상위 5 특징 중요도 분석

 

그림 4. RF 분류와 Ridge 특징 선택 기법 조합의 특징 중요도 분석 결과

상위 5 유의미한 특징은 다음과 같습니다:

  1. Perimeter (0.11): 2D Shape 특징. 특징의 다각형 부분의 전체 둘레 길이.
  2. Run Length Non Uniformity (0.10): GLRLM 특징. 같은 그레이 레벨 값을 가진 연속 픽셀 수의 유사성 측정. 값이 낮을수록 균일함을 나타냄.
  3. Major Axis Length (0.09): 2D Shape 특징. ROI 둘러싸는 타원체의 가장 길이.
  4. Total Energy (0.08): First Order 특징. 복셀 부피로 조정된 에너지 기능의 .
  5. Perimeter Surface Ratio (0.07): 2D Shape 특징. 표면에 대한 둘레 비율. 값이 낮을수록 원형 모양에 가까.

2. 선택/비선택 슬라이스 특징 차이 분석

상위 5 특징들이 외과 전문의가 '선택한(Select)' 슬라이스와 ' 외의(Non-select)' 슬라이스 간에 통계적으로 유의미한 차이(p<0.001) 보이는지 분석했습니다.

분석 결과, 외과 전문의가 선택한 슬라이스는 외의 슬라이스에 비해 다음과 같은 특징을 가졌습니다:

  • Perimeter: 값이 높다. (둘레 길이가 )
  • Run Length Non Uniformity: 값이 낮다. ( 균일함)
  • Major Axis Length: 값이 크다. (가장 길이가 )
  • Total Energy: 값이 크다. (에너지 기능 값이 )
  • Perimeter Surface Ratio: 값이 낮다. (원형 모양에 가까움)

이러한 결과는 외과 전문의가 직관적으로 선택했던 직장암 MRI 영상 슬라이스들이 정량적 라디오믹스 특징에서도 통계적으로 명확한 차이를 보이며, 특히 종양의 형태(Shape) 균일도(Texture) 관련된 특징들이 핵심적인 역할을 한다는 것을 시사합니다.


결론 전망: 직장암 수술의 미래

연구는 라디오믹스 기반 인공지능 분석을 통해 외과 전문의의 주관적 판단에 크게 의존했던 직장암 수술 위험도 예측 연구에서 정량적이고 객관적인 바이오마커 발굴하는 성공했습니다

핵심 성과:

  • 최적 모델 확인: RF 분류기와 Ridge 특징 선택 기법의 조합이 AUC 0.89+-0.09 가장 우수한 슬라이스 분류 성능을 .
  • 정량적 바이오마커 발굴: Perimeter, Run Length Non Uniformity, Major Axis Length, Total Energy, Perimeter Surface Ratio 다섯 가지 특징이 직장암 MRI 영상 슬라이스 선택 분류의 유의미한 생체지표로 사용 가능함을 확인했습니다.
  • 임상적 효율성 증대: 정량적 특징들은 MRI 영상 슬라이스 선택을 자동화하는 응용되어 , 외과 전문의가 직장암 수술 위험도를 예측할 빠른 판단력과 효율성 높이는 기여할 것으로 기대됩니다.

향후 과제 전망:

  • 데이터 규모 보완: 연구는 50명의 환자 데이터를 사용했다는 제한점이 있으므로, 데이터의 규모를 확장하여 연구 결과의 신뢰성을 높이는 후속 연구가 필요합니다.
  • 모델 고도화: 추가 데이터 수집 이미지 전처리 알고리즘 개발을 통해 학습 모델의 성능을 고도화하고, 라디오믹스 결과가 외과 전문의에게 더욱 만족할 만한 최적화된 정보를 제공할 있도록 연구를 지속해야 합니다.
  • 표적 치료 연계: 많은 데이터를 확보하여 예측 모델을 개선하면, MRI 영상을 통해 슬라이스 선택을 비침습적으로 검토하고 환자에게 필요한 유전적 정보를 도출하여 궁극적으로 표적 치료 효과적으로 진행되는 기여할 있을 것으로 전망됩니다.

라디오믹스와 인공지능 기술의 발전은 직장암 수술 위험도 예측의 패러다임을 '경험 기반'에서 '정량적 데이터 기반'으로 전환하며, 환자 맞춤형 치료 시대의 문을 열고 있습니다. 이러한 혁신적인 정량적 접근은 외과 전문의의 의사결정을 가속화하고, 환자들에게 나은 종양학적 결과를 제공하는 결정적인 역할을 것입니다.


References

  1. Valentini V, et al. Evidence and research in rectal cancer. Radiotherapy and Oncology. 2008;87(3):449-474. 72
  2. Shihab OC, et al. MRI staging of low rectal cancer. European radiology. 2009;19(3):643-650. 73
  3. Yamamoto T, et al. Prediction of surgical difficulty in minimally invasive surgery for rectal cancer by use of MRI pelvimetry. BJS Open. 2020;4(4):666-677. 74
  4. Kumar V, et al. Radiomics: the process and the challenges. Magnetic Resonance Imaging. 2012;30(9):1234-1248. 75
  5. Van Griethuysen JJM, et al. Computational Radiomics System to Decode the Radiographic Phenotype. Cancer research. 2017;77(21):e104-e107. 76
  6. Biau G, Scornet E. A random forest guided tour. TEST. 2016;25(2):197-227. 77
  7. Lu M. Embedded feature selection accounting for unknown data heterogeneity. Expert Systems with Applications. 2019;119:350-361

댓글

이 블로그의 인기 게시물

수면 건강 혁신: 기능성 직물 전도성 전극을 활용한 심전도 측정 기술의 최신 연구와 발전 방향

최첨단 진단 기술: 악성 포도막 흑색종 전이의 F-18 FDG PET/CT 조기 발견과 생존율 향상 전략

[유방암 영상의학] DCIS 업스테이징 예측을 위한 맘모그래피 기반 Radiomics: 최신 연구로 본 임상적 적용 가능성