기존 LLM 정확도·효율성 높이는 방안 제시
![]() |
이동준 두나무 머신러닝팀장이 ‘콜링 2025’에서 논문을 발표하는 모습 [두나무 제공] |
[헤럴드경제=차민주 기자] 블록체인·핀테크 전문 기업 두나무는 국제 학술대회인 ‘콜링 2025’ 콘퍼런스에서 자사 머신러닝(ML)팀의 연구 논문을 발표했다고 23일 밝혔다.
콜링은 자연어 처리(NLP)와 전산언어학 분야에서 권위 있는 학회 중 하나다. 구글 스칼라(Google Scholar)가 발표한 전산 언어학 분야 글로벌 상위 5대 학회에도 포함된다. 올해 콜링의 메인 콘퍼런스는 지난 21일(현지시간) 아랍에미리트(UAE) 아부다비의 ‘ADNEC(Abu Dhabi National Exhibition Centre)’에서 열렸다.
콜링 현장에서 이동준 두나무 머신러닝팀장은 두나무가 개발한 텍스트-SQL(구조화된 질의 언어) 변환 모델의 연구 성과를 직접 발표했다. 발표 논문의 제목은 ‘MCS-SQL: 텍스트-SQL 변환에서 다중 프롬프트와 다지선다를 활용하는 방법’이다.
![]() |
이동준 두나무 머신러닝팀장이 ‘콜링 2025’에서 논문을 발표하는 모습 [두나무 제공] |
기존 LLM은 답변이 일관적이지 않다는 한계가 있었다. 같은 내용임에도 질문 방식이나 문장 배치 순서 등에 따라 답변이 확연히 달랐던 것이다.
두나무 머신러닝팀은 이러한 문제를 해결하기 위해 다중 프롬프트 기법을 도입, 여러 SQL 후보를 생성한 뒤 최적의 SQL을 선택하는 방법을 제안했다. 이 방안을 채택하면 기존 LLM의 정확도와 효율성을 동시에 향상할 수 있다고 논문은 설명했다. 두나무에 따르면 이 모델은 지난해 1월 텍스트-SQL 변환 측정 벤치마크인 BIRD-SQL 글로벌 리더보드에서 1위를 차지하기도 했다.
이 팀장은 “생성형 AI와 함께 주목받는 텍스트-SQL 변환 분야에 대한 기술적 도전이 세계적으로 인정 받아 기쁘다”며 “이번 연구가 AI의 실질적 활용성을 넓히는데 조금이나마 보탬이 됐으면 좋겠다”고 했다.