LLM 활용 통계 생산·데이터 통합 체계 등 연구성과 공유
![]() |
| 안형준 국가데이터처장 [연합] |
[헤럴드경제=김용훈 기자] 인공지능(AI) 시대를 맞아 국가통계와 데이터의 활용 가치를 높이고 데이터 품질 관리 체계를 고도화하기 위한 논의의 장이 마련됐다. 민·관·학 전문가들은 AI 성능을 좌우하는 데이터 품질 확보와 국가통계 혁신을 위한 AI 활용 방안을 집중 논의했다.
국가데이터처는 25일 대전 통계센터에서 ‘AI시대, 국가통계·데이터의 새로운 가치와 활용’을 주제로 ‘2026 국가데이터연구 심포지엄’을 개최했다고 밝혔다.
2011년부터 이어져 온 이 심포지엄은 지난해 국가데이터연구원 출범을 계기로 국가통계 방법론 중심에서 데이터와 AI 전반으로 논의 범위를 확대했다. 올해 행사에서는 AI 대전환 시대를 맞아 데이터 품질과 통합, 국가통계 혁신을 위한 AI 활용 방안 등이 주요 의제로 다뤄졌다.
기조강연에 나선 고길곤 서울대 행정대학원 교수는 ‘인공지능 학습데이터 전환과 통계적 추론의 공진화’를 주제로 AI와 결합한 통계추론 시대 국가데이터의 의미와 학습데이터 전환 필요성을 강조했다. 또 국가데이터연구원의 미래 역할과 연구 방향도 제시했다.
심포지엄은 ▷인공지능과 데이터 품질 ▷인공지능 활용 통계 혁신 ▷데이터 융합과 정보보호 등 세 개 분과로 진행됐다.
첫 번째 분과에선 AI 성능의 핵심 요소인 데이터 품질 관리 방안이 논의됐다. 한국지능정보사회진흥원(NIA)은 대규모 고품질 학습데이터 구축 및 비정형 데이터 품질 확보 방안을 발표했고, 국가데이터연구원은 글로벌 연구기관의 데이터 품질관리 사례를 소개하며 AI 데이터 구축·관리 중요성을 강조했다.
두 번째 분과에서는 거대언어모델(LLM)을 활용한 설문조사와 감염병 사망 예측 등 AI 기반 통계 생산 사례가 소개됐다. 특히 AI를 활용한 조사데이터 품질 향상과 국가통계 품질관리 자동화 방안 등이 제안됐다.
마지막 분과에서는 데이터 통합 체계 구축과 개인정보 보호 기술을 주제로 논의가 이뤄졌다. 연구진은 데이터 연계성과 활용성을 높이기 위한 데이터 통합 프로세스 도입과 AI 학습용 데이터 보호를 위한 신기술 개발 필요성을 제시했다.
안형준 처장은 “AI 성능은 데이터 품질과 신뢰성에 의해 결정된다”며 “정확하고 체계적으로 구축된 국가통계와 데이터는 AI 시대 핵심 공공 인프라”라고 말했다. 이어 “심포지엄에서 제시된 다양한 의견을 반영해 데이터 품질 향상과 새로운 데이터 가치 창출을 위한 연구를 지속 확대하겠다”고 밝혔다.




