블록체인 >

두나무 머신러닝팀 'AI 신기술' 세계적 인정받아

콜링서 텍스트-SQL변환논문 발표
LLM 비일관성 해결안 찾아 눈길

두나무는 본사 머신러닝팀이 전산언어학 분야 국제학술대회인 '콜링(COLING) 2025' 콘퍼런스에서 텍스트-SQL(구조화된 질의언어) 변환 관련 연구 논문을 발표했다고 23일 밝혔다 .

콜링은 자연어 처리(NLP)와 전산언어학 분야에서 세계적으로 권위 있는 학회다. 구글 스칼라가 발표한 전산언어학 분야 글로벌 상위 5대 학회에도 포함됐다.

올해 콜링의 메인 콘퍼런스는 지난 21일(현지 시각) 아랍에미리트(UAE) 아부다비 국제 전시회장(ADNEC)에서 열렸다. 이 자리에서 이동준 두나무 머신러닝팀장은 두나무가 개발한 텍스트-SQL 변환 모델의 연구 성과를 발표했다. 발표 논문의 제목은 'MCS-SQL: 텍스트-SQL 변환에서 다중 프롬프트와 다지선다를 활용하는 방법'이다. 해당 논문은 LLM(대규모 언어 모델) 기반의 텍스트-SQL 변환 성능을 향상시키는 방법을 제안했다.

기존 LLM은 질문 방식이나 문장 배치순서 등에 따라 답변이 확연히 달라지는 '비일관성'이 한계로 작용했다. 예를 들어 "A와 B는 같은 뜻인가요?"와 "B와 A는 같은 뜻인가요?"라는 질문에 서로 다른 답변을 내놓을 수 있다는 것이다.
두나무 머신러닝팀은 이를 해결하기 위해 다중 프롬프트 기법을 도입해 여러 SQL 후보를 생성한 뒤 최적의 SQL을 선택하는 방법을 제안했다. 이는 기존 LLM의 정확도와 효율성을 동시에 향상할 수 있다는 연구 결과다. 이 모델은 지난해 1월 텍스트-SQL 변환 측정 벤치마크인 BIRD-SQL 글로벌 리더보드에서 1위를 차지하기도 했다.

localplace@fnnews.com 김현지 기자