스마트워치를 활용한 앙상블 학습 기반 우울증 예측과 특성 분석 — 실생활 데이터 기반 인공지능 접근

 스마트워치를 활용한 앙상블 학습 기반 우울증 예측과 특성 분석—실생활 데이터 기반 인공지능 접근

서론: 정신 건강 위기를 해결할 디지털 기술의 진화

우울증(Major Depressive Disorder, MDD)은 전 세계적으로 공중 보건에 심각한 부담을 주는 질환으로, 기존에는 주로 주관적 평가(자가보고 설문, 정신과 상담 등)에 의존한 진단 방식이 사용되어왔다. 하지만 최근 웨어러블 기술의 발전, 특히 스마트워치를 기반으로 한 생체 데이터 수집이 가능해지며, 객관적인 우울증 예측이 새로운 전기를 맞이하고 있다.

본 컬럼은 2024년 학술지 Journal of Biomedical Engineering Research에 게재된 연세대학교 연구팀의 논문 "스마트워치를 활용한 앙상블 학습 기반 우울증 예측 및 특성 분석"을 바탕으로, 해당 연구의 핵심 내용을 전문가 수준에서 분석하고, 관련 그림, 퀴즈, 키워드와 함께 구성하였다.

그림 1. 기계학습을 통한 우울증 분류 모델 학습방법 및 평가 모식도


기계학습을 통한 우울증 예측 모델 학습방법 및 평가 단계 요약 모식도. 데이터 수집 → 전처리 → 모델 학습 → SHAP 해석의 순서로 구성됨.

실세계 데이터(RWD) 기반 연구 설계 개요

  • 대상자: 강원도 원주 거주 55~85세 160명 대상

  • 수집 장치: 삼성 갤럭시 워치 II 스마트워치 + 스마트폰 앱

  • 데이터 종류: 걸음 수, 심박수, 수면 상태, PHQ-9 설문, 감정/스트레스 자가보고

  • 데이터 구성: 월 단위로 분절(segmentation)하여 총 3,008개의 샘플 확보

전처리 및 라벨링

  • 결측치 및 이상치 제거(Z-score ±3 기준)

  • PHQ-9 점수 5점 기준으로 우울증 여부 이진 라벨링

앙상블 학습 모델 비교

적용된 모델: Random Forest, XGBoost, LightGBM, CatBoost

표 1. 모델별 성능 비교 (Accuracy 기준)

  • Random Forest: 98.01%

  • XGBoost: 99.50%

  • LightGBM: 99.50%

  • CatBoost: 99.50%

그림 2. 앙상블 모델 혼동행렬 비교

각 모델의 테스트 세트 혼동행렬 비교. XGBoost, LightGBM, CatBoost가 모두 99.5%의 정확도를 달성.

변수 중요도 해석: SHAP 기반 XAI 접근

가장 중요한 변수들:

  • SS23: Rem 수면 단계의 변동성

  • SS28: Rem 수면 비율

  • SS15: 밤잠 전체 수면 시간

  • SS30: 전체 수면 상태의 변화도

그림 3. Random Forest 모델의 SHAP Waterfall Plot 및 Summary Plot


우울증 예측에 가장 기여한 상위 변수 시각화. 특히 SS23과 SS28이 높은 기여도를 가짐.

그림 4. XGBoost 모델의 SHAP 해석 시각화

 SS23은 음의 방향으로 예측값을 가장 크게 낮춘 요인으로 나타남. SS30은 예측 향상에 긍정적 기여.

퀴즈

문제 1: 본 연구에서 우울증 예측 정확도가 가장 높은 앙상블 모델은?

A. SVM

B. Random Forest

C. CatBoost

D. Gaussian Naive Bayes

문제 2: 우울증 예측에서 SHAP 분석을 통해 가장 중요한 변수로 공통적으로 지목된 수면 관련 항목은?

A. 심박수 평균값

B. REM 수면 단계의 변동성 (SS23)

C. 걸음 수

D. 스트레스 자가보고

문제 3: 본 연구의 데이터 전처리 단계에서 이상치를 제거하는 데 사용된 통계 기법은?

A. PCA

B. T-test

C. Z-Score

D. Chi-square


정답 및 해설

1. 정답: C 해설: CatBoost, XGBoost, LightGBM이 모두 99.50%로 가장 높았지만, CatBoost는 범주형 데이터에 특화되어 성능 우수성이 부각됨.

2. 정답: B 해설: SS23은 4개 모델 모두에서 가장 중요한 변수로 나타났으며, 수면의 질과 우울증의 상관관계를 시사한다.

3. 정답: C 해설: Z-score ±3 이상치를 제거하여 모델 학습 안정성을 확보하였다.


결론 및 미래 전망

본 연구는 웨어러블 기반의 실생활 데이터를 통해 우울증을 조기 예측할 수 있는 가능성을 제시했으며, 특히 수면 패턴이 핵심 변수로 작용함을 SHAP 분석을 통해 입증하였다. 향후 딥러닝 융합, 다양한 환경/계층 적용, 고정밀 진단 도구로 확장 가능하다.

참고문헌

[1] Koo SK, "Depression Status in Korea," Osong Public Health Res Perspect, vol. 9, no. 4, pp. 141–142, 2018. 

[2] Cheong CY et al., "National trends in counseling for stress and depression," Psychiatry Research, vol. 337, p. 115919, 2024. 

[3] Huang Y, Zhao N, "Generalized anxiety and depressive symptoms during COVID-19," Psychiatry Research, vol. 288, p. 112954, 2020. 

[4] Salari N et al., "Depression during COVID-19: Meta-analysis," Global Health, vol. 16, no. 1, 2020. 

[5] Mobram S et al., "Depression detection using speech features," Comput. Biol. Med., vol. 149, p. 105926, 2022. 

[6] Marx W et al., "Major depressive disorder: Primer," Nature Rev. Dis. Primers, vol. 9, p. 44, 2023. 

[7] Liu F, Panagiotakos D, "Real-world data in psychiatry," BMC Med Res Methodol., vol. 22, no. 1, p. 287, 2022.

댓글

이 블로그의 인기 게시물

수면 건강 혁신: 기능성 직물 전도성 전극을 활용한 심전도 측정 기술의 최신 연구와 발전 방향

최첨단 진단 기술: 악성 포도막 흑색종 전이의 F-18 FDG PET/CT 조기 발견과 생존율 향상 전략

[유방암 영상의학] DCIS 업스테이징 예측을 위한 맘모그래피 기반 Radiomics: 최신 연구로 본 임상적 적용 가능성