Pulse · AI 뉴스

CNN·GRU 기반 네트워크로 천식·COPD 감별 진단 시 최적화된 2D 입력 표현 및 서브 페이즈 융합 전략 연구

arXiv cs.AI · 2026-06-10

본 연구는 딥러닝을 활용하여 VAR 모델과 MFCC 매트릭스, 로그-멜 스펙트로그램의 성능을 비교 분석합니다. 폐음 분류에서 스펙트로그램 기반 표현은 호흡 주기 길이의 차이로 인해 일관성 없는 시간 차원을 갖는다는 한계가 있습니다. 이를 해결하기 위해 기존의 트리밍/제로 패딩 방식 외에 적응형 길이 창 윈도잉 기법이 제시되었습니다.

서브 페이즈에서 다양한 CNN 아키텍처를 활용하여 2차원 표현으로부터 특징을 추출하고, 직접 연결, GRU 네트워크, GRU with 어텐션 메커니즘 등 다양한 전략으로 특징을 융합했습니다. 호흡 주기 기반 평가 및 여러 호흡 주기를 포함하는 피험자 기반 평가를 통해 모델 성능을 평가했습니다.

데이터 크기 제한을 극복하기 위해 여러 데이터 증강 기법을 연구한 결과, MFCC 매트릭스를 사용하여 13개의 계수와 서브 페이즈 표현당 64점의 시간 해상도를 적용하고 직접 특징 연결했을 때 가장 높은 주기 기반 F1 점수(0.877)를 얻었습니다. 피험자 기반 F1 점수(0.855)는 전체 주기 표현에 13개의 계수와 서브 페이즈당 256점의 시간 해상도를 갖는 MFCC 매트릭스를 사용했을 때 얻었습니다.

MFCC가 로그-멜 스펙트로그램과 VAR 모델보다 천식과 COPD 감별에 더 효과적이었으며, 복잡한 융합 전략은 진단을 개선하지 못했습니다. 데이터 증강은 성능을 저하시켰으며, 이는 폐음 연구에서 진실된 데이터의 중요성을 시사합니다.

##딥러닝##폐음분석##천식##COPD##감별진단

매일 핵심 AI 소식을 한국어로, 빠르게

App Store 에서 Pulse 받기 앱에서 열기