초음파 영상에서의 딥러닝 기반 바늘 검출: D-Attention Unet의 혁신적 접근
doi:10.9718/JBER.2020.41.5.195
의료 영상 분석은 최근 인공지능(AI)과 딥러닝(Deep Learning)의 눈부신 발전과 함께 새로운 도약을 맞이하고 있습니다.
특히, 초음파 영상(Ultrasound Image)은 비용 효율성과 실시간성 덕분에 임상 현장에서 광범위하게 활용되지만, 영상 해석의 난이도로 인해 정확한 진단 보조에는 한계가 있었습니다.
그중에서도 바늘 검출(Needle Detection)은 생검(biopsy)이나 근접치료(brachytherapy)와 같은 침습적 시술에서 환자의 안전과 직결되는 핵심 기술입니다.
최근 발표된 연구에서는 이러한 문제를 해결하기 위해 3D 영상과 연속 영상 문맥(context)을 동시에 활용한 새로운 딥러닝 모델, D-Attention Unet을 제안하였습니다
본 칼럼에서는 이 모델의 원리와 임상적 가치, 그리고 기존 모델과의 차별성을 전문가적 관점에서 분석합니다.
1. 기존 초음파 영상 분석의 한계
초음파 영상에서 바늘을 정확히 검출하기 어려운 이유는 다음과 같습니다.
-
조직과 바늘의 유사성: 초음파 영상에서 바늘은 종종 주변 지방조직과 비슷한 밝기나 형태를 보여 구분이 어렵습니다.
-
영상 노이즈(Noise): 초음파 특유의 산란과 잡음이 바늘 검출 성능을 저하시킵니다.
-
연속성 결여: 대부분의 딥러닝 모델은 개별 정지영상(2D) 단위로 학습되므로, 시계열적 특성이 충분히 반영되지 않습니다.
이러한 한계를 극복하기 위해 기존에는 Unet, D-Unet, Attention-Unet과 같은 다양한 변형 모델이 시도되었습니다.
그러나 여전히 3D 정보 손실과 오버피팅 문제가 존재했습니다.
2. D-Attention Unet: 새로운 해결책
D-Attention Unet은 D-Unet의 차원 융합(dimension-fusion) 구조와 Attention Unet의 주의 메커니즘(attention mechanism)을 결합한 하이브리드 모델입니다.
-
3D와 2D 정보 결합: D-Unet의 구조를 차용해 3D 문맥 정보를 효과적으로 반영.
-
Attention Gate 도입: 학습 시 불필요한 외부 조직을 배제하고, 바늘과 같은 주요 객체에 집중.
-
연속 영상 활용: 개별 이미지가 아니라 **연속된 프레임(시간축)**을 함께 학습하여 바늘의 위치와 움직임을 더 정밀하게 파악.
그림 1. 데이터 구성 예시
493개의 정지영상을 네 장씩 묶어 학습에 활용
3. 모델 구조 비교
아래 그림은 기존 Unet과 D-Attention Unet의 구조적 차이를 보여줍니다.
그림 2. Unet 구조
전통적인 U자형 네트워크, 2D 영상 기반 분할(Segmentation)에 강점
그림 3. D-Attention Unet 구조
3D 차원 변형 블록과 Attention Gate를 결합한 하이브리드 네트워크
그림 4. 차원 변형 블록 내부 구조
3D와 2D 네트워크의 출력을 결합하는 핵심 모듈
이 구조 덕분에 D-Attention Unet은 적은 데이터로도 높은 정확도를 유지할 수 있습니다.
4. 성능 평가
연구진은 493장의 초음파 영상 데이터셋을 학습과 검증에 사용했습니다. 각 모델의 성능은 Dice Similarity Coefficient (DSC), Recall, Precision으로 평가되었습니다.
표 1. Epoch에 따른 D-Attention Unet 성능
Epoch 300일 때 최적 성능 (DSC 0.719, Recall 0.706, Precision 0.737)
-
Epoch 400 이후에는 오버피팅 발생
표 2. 기존 모델과 성능 비교 (첨부파일 Table 2)
결과적으로, D-Attention Unet이 모든 지표에서 가장 우수한 성능을 기록했습니다.
그림 5. 바늘 검출 결과 예시
(a) 예측된 바늘 마스크, (b) 원본 영상에 표시된 바늘 검출 결과
5. 임상적 가치와 활용 가능성
D-Attention Unet의 등장은 다음과 같은 임상적 가치를 가집니다.
-
생검(biopsy) 정확도 향상: 병리 조직 채취 시 목표 부위 정확히 지정 가능.
-
근접치료(brachytherapy) 안전성 확보: 종양 내부에 방사선 시드를 정확히 삽입.
-
시술 시간 단축: 실시간 바늘 검출로 의료진의 부담 감소.
-
자동화 진단 보조: 향후 AI 기반 초음파 자동 진단 시스템의 핵심 모듈로 발전 가능.
6. 향후 연구 방향
연구에서는 몇 가지 한계도 보고되었습니다.
-
일부 영상에서 바늘 끝이 짧게 검출되거나 끊어지는 오류 발생.
-
학습 데이터 부족으로 인해 일반화 성능에 한계.
이를 해결하기 위해 제안된 방법은:
-
RANSAC(Random Sample Consensus) 등 전통적 영상처리 기법과의 융합.
-
차영상(Difference Image) 기반 바늘 움직임 분석 병합.
-
대규모 데이터셋 확보 및 다기관 임상 검증.
7. 결론
본 연구에서 제안된 D-Attention Unet은 3D 정보와 연속 영상 문맥을 효과적으로 결합하여 초음파 영상에서의 바늘 검출 정확도를 크게 향상시켰습니다.
이는 향후 AI 기반 의료영상 분석의 중요한 전환점이 될 것으로 기대됩니다.
특히, 생검 및 근접치료와 같은 고위험 시술에서의 안전성 확보는 환자와 의료진 모두에게 큰 의미를 갖습니다.
앞으로 D-Attention Unet이 다양한 3D 의료 영상 분야로 확장된다면, 의료 AI의 임상 적용은 한층 더 가속화될 것입니다.
참고문헌
[1] A. Kamilaris, F. X. Prenafeta-Boldú, “Deep learning in agriculture: A survey,” Comput. Electron. Agric., vol. 147, pp. 70-90, 2018.
[2] D. Shen, G. Wu, H.-I. Suk, “Deep learning in medical image analysis,” Annu. Rev. Biomed. Eng., vol. 19, pp. 221-248, 2017.
[3] Z.-Q. Zhao, P. Zheng, S. Xu, X. Wu, “Object detection with deep learning: A review,” IEEE Trans. Neural Netw. Learn. Syst., vol. 30, no. 11, pp. 3212-3232, 2019.
[4] P. Rajpurkar et al., “CheXNet: Radiologist-level pneumonia detection on chest X-rays with deep learning,” arXiv preprint arXiv:1711.05225, 2017.
[5] A. Krizhevsky, I. Sutskever, G. E. Hinton, “ImageNet classification with deep convolutional neural networks,” in Advances in Neural Information Processing Systems, vol. 25, pp. 1097-1105, 2012.
[6] O. Ronneberger, P. Fischer, T. Brox, “U-Net: Convolutional networks for biomedical image segmentation,” in Proc. Int. Conf. Med. Image Comput. Comput.-Assist. Intervent., pp. 234–241, 2015.
[7] Y. Zhou et al., “D-UNet: A dimension-fusion U shape network for chronic stroke lesion segmentation,” IEEE/ACM Trans. Comput. Biol. Bioinform., 2019.
댓글
댓글 쓰기