스마트워치를 활용한 앙상블 학습 기반 우울증 예측과 특성 분석 — 실생활 데이터 기반 인공지능 접근
스마트워치를 활용한 앙상블 학습 기반 우울증 예측과 특성 분석—실생활 데이터 기반 인공지능 접근
서론: 정신 건강 위기를 해결할 디지털 기술의 진화
우울증(Major Depressive Disorder, MDD)은 전 세계적으로 공중 보건에 심각한 부담을 주는 질환으로, 기존에는 주로 주관적 평가(자가보고 설문, 정신과 상담 등)에 의존한 진단 방식이 사용되어왔다. 하지만 최근 웨어러블 기술의 발전, 특히 스마트워치를 기반으로 한 생체 데이터 수집이 가능해지며, 객관적인 우울증 예측이 새로운 전기를 맞이하고 있다.
본 컬럼은 2024년 학술지 Journal of Biomedical Engineering Research에 게재된 연세대학교 연구팀의 논문 "스마트워치를 활용한 앙상블 학습 기반 우울증 예측 및 특성 분석"을 바탕으로, 해당 연구의 핵심 내용을 전문가 수준에서 분석하고, 관련 그림, 퀴즈, 키워드와 함께 구성하였다.
그림 1. 기계학습을 통한 우울증 분류 모델 학습방법 및 평가 모식도
기계학습을 통한 우울증 예측 모델 학습방법 및 평가 단계 요약 모식도. 데이터 수집 → 전처리 → 모델 학습 → SHAP 해석의 순서로 구성됨.
실세계 데이터(RWD) 기반 연구 설계 개요
대상자: 강원도 원주 거주 55~85세 160명 대상
수집 장치: 삼성 갤럭시 워치 II 스마트워치 + 스마트폰 앱
데이터 종류: 걸음 수, 심박수, 수면 상태, PHQ-9 설문, 감정/스트레스 자가보고
데이터 구성: 월 단위로 분절(segmentation)하여 총 3,008개의 샘플 확보
전처리 및 라벨링
결측치 및 이상치 제거(Z-score ±3 기준)
PHQ-9 점수 5점 기준으로 우울증 여부 이진 라벨링
앙상블 학습 모델 비교
적용된 모델: Random Forest, XGBoost, LightGBM, CatBoost
표 1. 모델별 성능 비교 (Accuracy 기준)
Random Forest: 98.01%
XGBoost: 99.50%
LightGBM: 99.50%
CatBoost: 99.50%
그림 2. 앙상블 모델 혼동행렬 비교
각 모델의 테스트 세트 혼동행렬 비교. XGBoost, LightGBM, CatBoost가 모두 99.5%의 정확도를 달성.
변수 중요도 해석: SHAP 기반 XAI 접근
가장 중요한 변수들:
SS23: Rem 수면 단계의 변동성
SS28: Rem 수면 비율
SS15: 밤잠 전체 수면 시간
SS30: 전체 수면 상태의 변화도
그림 3. Random Forest 모델의 SHAP Waterfall Plot 및 Summary Plot
그림 4. XGBoost 모델의 SHAP 해석 시각화
SS23은 음의 방향으로 예측값을 가장 크게 낮춘 요인으로 나타남. SS30은 예측 향상에 긍정적 기여.
퀴즈
문제 1: 본 연구에서 우울증 예측 정확도가 가장 높은 앙상블 모델은?
A. SVM
B. Random Forest
C. CatBoost
D. Gaussian Naive Bayes문제 2: 우울증 예측에서 SHAP 분석을 통해 가장 중요한 변수로 공통적으로 지목된 수면 관련 항목은?
A. 심박수 평균값
B. REM 수면 단계의 변동성 (SS23)
C. 걸음 수
D. 스트레스 자가보고문제 3: 본 연구의 데이터 전처리 단계에서 이상치를 제거하는 데 사용된 통계 기법은?
A. PCA
B. T-test
C. Z-Score
D. Chi-square정답 및 해설
1. 정답: C 해설: CatBoost, XGBoost, LightGBM이 모두 99.50%로 가장 높았지만, CatBoost는 범주형 데이터에 특화되어 성능 우수성이 부각됨.
2. 정답: B 해설: SS23은 4개 모델 모두에서 가장 중요한 변수로 나타났으며, 수면의 질과 우울증의 상관관계를 시사한다.
3. 정답: C 해설: Z-score ±3 이상치를 제거하여 모델 학습 안정성을 확보하였다.
결론 및 미래 전망
본 연구는 웨어러블 기반의 실생활 데이터를 통해 우울증을 조기 예측할 수 있는 가능성을 제시했으며, 특히 수면 패턴이 핵심 변수로 작용함을 SHAP 분석을 통해 입증하였다. 향후 딥러닝 융합, 다양한 환경/계층 적용, 고정밀 진단 도구로 확장 가능하다.
참고문헌
[1] Koo SK, "Depression Status in Korea," Osong Public Health Res Perspect, vol. 9, no. 4, pp. 141–142, 2018.
[2] Cheong CY et al., "National trends in counseling for stress and depression," Psychiatry Research, vol. 337, p. 115919, 2024.
[3] Huang Y, Zhao N, "Generalized anxiety and depressive symptoms during COVID-19," Psychiatry Research, vol. 288, p. 112954, 2020.
[4] Salari N et al., "Depression during COVID-19: Meta-analysis," Global Health, vol. 16, no. 1, 2020.
[5] Mobram S et al., "Depression detection using speech features," Comput. Biol. Med., vol. 149, p. 105926, 2022.
[6] Marx W et al., "Major depressive disorder: Primer," Nature Rev. Dis. Primers, vol. 9, p. 44, 2023.
[7] Liu F, Panagiotakos D, "Real-world data in psychiatry," BMC Med Res Methodol., vol. 22, no. 1, p. 287, 2022.
댓글
댓글 쓰기