"'으째쓰까나'가 무슨 뜻이야?"
"'으째쓰까나'는 '어떻게 해야 할까' 또는 '어떻게 하면 좋을까'와 같은 의미를 가진 전라도 사투리입니다."
최근 발표된 네이버의 초대규모 인공지능(AI) 하이퍼클로바X 기반 대화형 서비스'클로바X'에게 사투리 질문을 해봤다. 전라도인지 경상도인지 지역을 가끔 헷갈려 하긴 해도 대부분 정확한 답을 내놓는다는 점이 놀라웠다. 이처럼 한국 문화에 초점을 맞춘 탓에 내수용이라는 비판도 나오지만, 향후 학습을 통해 전 세계적으로 활용될 가능성도 엿보였다. 하이퍼클로바X 모델을 써봤다는 국내 스타트업들 후기도 나쁘지 않아 AI 기업간거래(B2B) 서비스시장에서의 성적도 기대된다.
카카오도 올 하반기 자체 AI 대규모 언어모델(LLM) '코지피티 2.0'을 선보일 예정이다. 초거대 AI 이미지 생성모델 '칼로(Karlo)'로는 북미시장 공략에 나선다. 북미는 미드저니, 스테이블디퓨전 등 대표 AI 이미지 생성모델들의 주무대다. 2~3등은 살아남을 수 없다는 위기감으로 1등이 되기 위해 서비스 고도화에 매진하고 있다는 설명이다.
국내 생성형 AI 시장이 빠르게 성장 중이다. 생성형 AI 돌풍을 일으킨 건 구글·MS 같은 글로벌 기업들이지만 플랫폼, 통신사, 게임사(엔씨소프트) 등 국산 AI 모델도 발 빠르게 경쟁력을 키워나가고 있다.
다음 단계는 AI 모델 고도화를 위한 고품질 데이터 확보다. 양질의 데이터를 학습할수록 AI 모델은 더 똑똑해지기 때문이다. 다만 저작물을 AI가 무단으로 학습하고 있다는 비판도 거세다. 해외에선 이미 생성형 AI 개발사를 상대로 한 손해배상 소송이 활발하게 진행되고 있다. AI 데이터 학습 저작권에는 민감한 뉴스 저작권 문제까지 걸려 있어 단순 해법을 찾기는 요원해 보인다.
현장에서는 기준이 필요하다고 토로한다.
데이터 활용에 대한 가이드라인이 모호한 탓에 리스크가 크다는 것이다. 이에 과학기술정보통신부 등에서도 AI 학습 데이터에 관련해 의견을 청취하고 고민 중이다. 저작권자에 대한 적절한 보상체계를 마련하고, 국내 AI 개발사가 경쟁력을 확보할 수 있도록 제도적 뒷받침이 시급한 시점이다.
soup@fnnews.com 임수빈 정보미디어부 기자
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지