“콜록콜록 소리 딱 걸렸어”…카메라가 기침 환자 잡아낸다

카메라가 연구실에서 기침 발생 위치를 표시하는 모습 [KAIST 제공]

[헤럴드경제=정태일 기자]KAIST는 실시간으로 기침 소리를 인식하고 기침하는 사람의 위치를 이미지로 표시해주는 '기침 인식 카메라'를 개발했다고 3일 밝혔다.

KAIST 기계공학과 박용화 교수 연구팀은 비대면으로 기침하는 사람의 증상을 파악할 수 있도록 기침 소리를 실시간으로 인식하는 딥러닝 기반의 기침 인식 모델을 개발했다.

기침 인식 모델을 음향 카메라에 적용해 기침 소리와 기침하는 사람의 위치, 심지어 기침 횟수까지도 실시간 추적 및 기록이 가능하다.

연구진은 1초 길이 음향신호의 특징(feature)을 입력 신호로 받아, 1(기침) 또는 0(그 외)의 2진 신호를 출력했다. 학습 최적화를 위해 일정 기간 학습률이 정체되면 학습률 값을 낮추도록 설정했다.

연구진은 기침 인식 모델의 훈련 및 평가를 위해 구글과 유튜브 등에서 연구용으로 활발히 사용 중인 공개 음성데이터 세트에서 데이터 세트를 수집했다. 이 중 '오디오세트'는 훈련 및 평가 데이터 세트 구성을 위해 사용했고 다른 데이터 세트의 경우 기침 인식 모델이 다양한 배경 소음을 학습할 수 있도록 데이터 증강을 위한 배경 소음으로 사용했다.

데이터 증강을 위해 배경 소음을 15~75%의 비율로 '오디오세트'에 섞은 후, 다양한 거리에 적응할 수 있게 음량을 0.25~1.0배로 조정했다. 훈련 및 평가 데이터 세트는 증강된 데이터 세트를 9:1 비율로 나눠 구성했으며, 시험 데이터 세트는 따로 사무실에서 녹음한 것을 사용했다. 그 결과 87.4%의 시험 정확도를 얻을 수 있었다.

(왼쪽부터) 박용화 교수, 김영기 대표, 이경태 박사과정, 김성후 박사과정, 남현욱 박사과정 [KAIST 제공]

연구진은 이어 학습된 기침 인식 모델을 소리를 수집하는 음향 카메라에 적용했다. 그 결과 기침 인식 모델이 기침 소리로 인식할 경우 기침 소리가 난 위치에 등고선과 라벨이 각각 표시된다.

박 교수팀은 여러 잡음 환경에서도 기침 소리와 그 이외의 소리로 구분이 가능하며 기침하는 사람과 그 사람의 위치, 횟수 등을 실시간으로 추적해 현장에서의 적용 가능성을 확인했다. 연구팀은 추후 병원 등 실사용 환경에서 추가 학습이 이뤄진다면 정확도는 87.4%보다 더 높아질 것으로 기대하고 있다.

박 교수는 "코로나19가 지속적으로 전파되고 있는 상황에서 공공장소와 다수 밀집 시설에 기침 인식 카메라를 활용하면 전염병의 방역 및 조기 감지에 큰 도움이 될 것"이라며 "특히 병실에 적용하면 환자의 상태를 24시간 기록해 치료에 활용할 수 있기 때문에 의료진의 수고를 줄이고 환자 상태를 더 정밀하게 파악할 수 있을 것"이라고 강조했다.

killpass@heraldcorp.com

Print Friendly