한 노인이 노인복지센터에서 한국전자통신연구원의 노년층 음성 발화 분석 시스템을 실증하고 있다. [한국전자통신연구원 제공] |
국내 연구진이 노년층의 음성 발화(發話)를 분석해 치매 전 단계인 경도인지장애·치매 고위험군을 선별하는 인공지능(AI) 기술을 개발했다.
한국전자통신연구원(ETRI)은 국가과학기술연구회(NST) 지원을 받아 일상생활의 대화 등을 통해 입력되는 노년층의 음성 발화를 분석해 경도인지장애, 치매 등 퇴행성 뇌 기능 저하를 평가하고 예측하는 AI 기술 연구를 진행 중이라고 2일 밝혔다.
음성 발화는 기억, 의도, 주의집중 등 인지 기능과 음운, 통사, 의미 등 언어 생성 기능, 호흡, 조음, 발성 등 구어 운동 기능이 순차적으로 작용하는 복합적인 과정이다.
이러한 발화 분석을 통해 경도인지장애·치매 환자에게서 나타나는 인지·언어·운동 능력의 저하를 조기에 판단하고 예측하는 것이 가능하다.
ETRI 복합지능연구실 연구팀은 음성처리 분야에서 축적된 AI 기술과 음성·텍스트·영상 멀티모달 기술을 바탕으로 디지털 치료제 등 헬스케어 분야로 연구를 확장하고 있다.
연구팀은 기존 음성·텍스트 분석 기술에 더해 세계 최초로 대형언어모델(LLM)을 결합한 알츠하이머 치매 예측 연구를 통해 영국 에든버러대와 미국 카네기멜론대에서 주최한 ‘어드레소(ADReSSo) 챌린지 데이터셋’에서 기존에 발표된 85.4%을 뛰어넘는 87.3%의 최고 성능을 획득했다.
연구팀은 후속 연구로 최근 각광을 받고 있는 시각언어모델(VLM) 기술을 적용해 동일한 어드레소 챌린지에서 최고 성능을 갱신한바 있다.
이 같은 연구 결과를 바탕으로 일상생활 대화 과제를 중심으로 한 음성 발화 입력을 통해 경도인지장애 고위험군을 예측하는 태블릿 기반 애플리케이션 개발을 완료했다.
노년층, 특히 경도인지장애·치매 고위험군에서 흔히 나타나는 부정확한 발음, 사투리 발화 등으로 인해 분석에 어려움이 있지만 축적된 음성·멀티모달 AI 기술을 바탕으로 이를 극복했다. 실제 수요자인 노년층의 사용자 편의성과 정확도 개선에 주안점을 두고 개발했고, 한국전기연구원과 연계해 노인복지센터 등에서 실증을 계획 중이다.
강병옥 ETRI 복합지능연구실 책임연구원(박사)은 “기존 보건소에 직접 방문해 선별검사를 받는 방식에 비해, 스마트기기를 통한 대화 기반의 검사 방식은 지속적·주기적 모니터링이 가능하다는 장점이 있다”고 말했다.
해당 기술을 통해 많은 치매 고위험군 노년층이 조기에 경도인지장애 여부를 확인하고 초기부터 지속적인 관리를 통해 치매로 진행을 최대한 늦출 수 있도록 만들어 향후 초고령 사회의 가장 심각한 치매 문제해결에도 많은 도움을 줄 것으로 연구팀은 기대하고 있다. 구본혁 기자