IT >

'바드'가 정확도, '챗GPT'보다 한수위...환각은 공통문제

바드, 챗GPT, 빙 AI 챗봇 비교해 보니

'바드'가 정확도, '챗GPT'보다 한수위...환각은 공통문제
바드 화면 캡처

[파이낸셜뉴스] 구글이 인공지능(AI) 챗봇 '바드(Bard)'를 전격 공개하면서 앞서 나온 오픈AI 챗GPT, 마이크로소프트(MS) 빙(Bing)과의 차별성에 대한 관심이 높아지고 있다. 결로부터 얘기하면 여러 번 질문해본 결과, 바드는 챗GPT, 빙보다는 비교적 정확했다. 또 빙은 검색 결과에 의존하는 듯해 구체성이 떨어졌지만, 바드는 답변 결과를 정리하고 해석이 첨가된 내용을 제시해 보다 편리했다.

"최신 정보 강점" 바드, 정확도 높은 편

'바드'가 정확도, '챗GPT'보다 한수위...환각은 공통문제
구글 바드 검색 결과 캡처

13일 업계에 따르면 구글은 연례개발자회의(I/O)에서 바드의 한국어 서비스를 시작했다. 영어만 제공하던 바드가 한국어로 묻고 답하는 게 가능해졌다는 의미다. 챗GPT나 MS 빙은 이미 이 같은 서비스를 진행하고 있었다. 실제 기자가 사용해본 결과, 바드, 챗GPT, 빙은 '정확성'이나 '정보의 최신성' 등에서 차이가 있었다.

"올해 1·4분기 대한민국 주요 게임사 실적(매출, 영업이익) 정리해줘"라고 부탁하자 바드는 표 형식으로 실적을 정리해 표기했다. 네오위즈를 제외하고는 실제 게임사들이 발표한 실적과 동일한 결과가 도출됐다.

반면 챗GPT는 모든 게임사들의 실적에 대해 엉뚱한 대답을 내놓았다.

챗GPT 무료 버전은 2021년까지만 정보가 업데이트돼 있기 때문이다. 무료로 이용자에게 최신 정보를 제공하는 바드와 달리 최신 정보가 담긴 버전은 유료로 이용되고 있다. 빙은 "대한민국 게임사들의 1·4분기 실적은 대체로 부진한 모습을 보였다"며 세 줄 요약 형식으로 답을 내놨다. 구체적인 수치와 출처는 링크로 표현하는 데 그쳤다.

"환각은 어쩔 수 없는 문제‥"

다만 3가지 AI 서비스 모두 정확도 측면에서는 보완이 필요하다는 지적이다.

챗GPT나 빙이 지적 받은 지적된 할루시네이션(환각)' 문제는 바드에서도 드러났다. 할루시네이션은 틀린 정보를 진짜처럼 답하는 것이다.
"파이낸셜뉴스에 대해 설명해달라"고 하자 구체적인 답변이 나왔지만 창간 일에 대해서는 잘못 답변했다. 이에 "창간일이 맞냐"고 다시 물어보자 정정한 결과를 보여줬다.

김명주 서울여대 정보보호학과 교수(바른AI연구센터장)는 "환각 문제는 지금 나온 AI 모델의 한계라 업계에서도 지속적으로 고민하고 있다"라면서 "헛소리를 하지 않게 하려면 도메인을 줄이거나 미세조정을 통해 보완할 수밖에 없다"고 설명했다. soup@fnnews.com 임수빈 기자