상황에 따라 끊임없이 새롭게 결정해야 하는 기업의 의사결정 문제는 지난 수십 년간 기업이 전문적인 데이터 분석팀과 고가의 상용 데이터베이스 솔루션을 통해 해결해 왔다.
KAIST는 김민수(사진) 전산학부 교수 연구팀이 의사결정 문제, 기업 데이터베이스, 비즈니스 규칙 집합, 세 가지가 주어졌을 때 거대언어모델(LLM)을 이용해 의사결정에 필요한 정보를 데이터베이스로부터 찾고, 비즈니스 규칙에 부합하는 최적의 의사결정을 도출할 수 있는 기술 ‘계획 RAG’를 개발했다고 19일 밝혔다.
거대언어모델은 매우 방대한 데이터를 학습했기 때문에 학습에 사용된 바 없는 데이터를 바탕으로 답변할 때나 오래전 데이터를 바탕으로 답변하는 등 문제점들이 지적돼왔다. 이런 문제들을 해결하기 위해 거대언어모델이 학습된 내용만으로 답변하는 것 대신, 데이터베이스를 검색해 답변을 생성하는 검색 증강 생성(RAG) 기술이 최근 각광받고 있다.
하지만 사용자의 질문이 복잡할 경우 다양한 검색 결과를 바탕으로 추가 정보를 다시 검색하여 적절한 답변을 생성할 때까지 반복하는 ‘반복적 RAG’라는 기술이 개발됐으며, 이는 현재까지 개발된 가장 최신 기술이다.
연구팀은 기업 의사결정 문제가 GPT-3.5 터보에서 반복적 RAG 기술을 사용하더라도 정답률이 10% 미만에 이르는 고난도 문제임을 보이고, 이를 해결하기 위해 반복적 RAG 기술을 한층 더 발전시킨 계획 RAG라는 기술을 개발했다.
계획 RAG는 기존 RAG 기술과 다르게 주어진 의사결정 문제, 데이터베이스, 비즈니스 규칙을 바탕으로 어떤 데이터 분석이 필요한지에 대한 거시적 차원의 계획을 먼저 생성한 후, 그 계획에 따라 반복적 RAG를 이용해 미시적 차원의 분석을 수행한다.
이는 마치 기업의 의사결정권자가 어떤 데이터 분석이 필요한지 계획을 세우면, 그 계획에 따라 데이터 분석팀이 데이터베이스 솔루션을 이용해 분석하는 형태와 유사하며, 다만 이러한 과정을 모두 사람이 아닌 거대언어모델이 수행하는 것이 커다란 차이점이다. 계획 RAG 기술은 계획에 따른 데이터 분석 결과로 적절한 답변을 도출하지 못하면, 다시 계획을 수립하고 데이터 분석을 수행하는 과정을 반복한다.
김 교수는 “기존 반복적 RAG에 비해 계획 RAG가 의사결정 정답률을 최대 32.5% 개선하는 것으로 나타났다”며 “기업이 복잡한 비즈니스 상황에서 최적의 의사결정을 사람이 아닌 거대언어모델을 이용하여 내리는데 적용되길 기대한다”고 말했다.
구본혁 기자