IT >

'사오정'AI 비서 속출.. 업계, 인식률 높이기 안간힘

관련종목▶

이용자 음석인식 잘못하고 물건 배송하는 사례 등장
업계, 서비스 고도화 위해 딥러닝 기법으로 교육
아마존, 소음구분기술 연구.. 바이두는 中 방언 수집도

#. 최근 미국에서 TV 뉴스 앵커가 "'알렉사가 인형 집을 사 줬어요'라고 말하는 여자아이가 사랑스럽네요"라고 말하자 음성인식 비서인 알렉사가 이를 자신에게 명령하는 것으로 잘못 알아듣고 아마존에 인형집을 주문하는 사례가 발생했다. 비슷한 소비자들의 항의가 이어지자 아마존에서는 알렉사가 주문한 물건에 대해서는 누구나 비용없이 반품할수 있도록 했다.

'사오정'AI 비서 속출.. 업계, 인식률 높이기 안간힘

세계인의 가정에 급속히 파급되고 있는 '초짜' 인공지능(AI) 비서들이 실수를 하는 사례도 확산되고 있다. 아직 주인의 음성을 정확하게 가려내지 못하는게 원인이다.

이 때문에 AI 비서 서비스를 제공하는 기업들이 AI비서 서비스 대중화와 함께 본격적으로 비서들의 음성인식률 높이기에 나서고 있다. 비서들이 주인의 음성을 TV 앵커의 목소리와 구분해낼 수 있도록하고, 문맥을 정확하게 파악할 수 있도록 교육시키기 위해 방대한 양의 데이터 수집에 나서고 있는 것이다.

지난해 본격적으로 시장을 열기 시작한 AI 음성비서 서비스가 올해부터는 서비스 고도화를 위한 데이터 수집 경쟁이 시작된 것이다.

■소음 데이터 모으고, 딥러닝으로 인식률 높여라

9일 업계에 따르면 음성인식 비서 서비스를 제공하는 글로벌 기업들이 잇따라 음성인식률을 높이기 위해 본격적인 데이터 확보에 나서고 있다. 가능한 많은 데이터를 수집해 주인의 음성과 구분하도록 딥러닝 기법을 동원해 교육시킨 비서가 결국 AI비서 시장에서 경쟁력을 확보할 수 있기 때문이다.

특히 TV나 라디오 등에서 나오는 소리가 사람의 목소리라는 점에서 AI비서들은 아직 주인의 명령과 구분하지 못하는게 현실이다.

업계 한 관계자는 "TV 스피커에서 나오는 소리와 육성으로 실제 발성을 하는 소리는 특성이 약간 다르기 때문에 TV소리를 잡음으로 판단할 수 있도록 딥러닝을 시키면 육성과 TV소리를 어느정도 구분할 수 있게된다"고 설명했다. 이에 업체들은 가상의 환경을 모델링해 사용자가 사용하게 되는 환경의 가상 데이터를 생성한 후 학습에 활용하겠다고 나서고 있다.

국내에서 AI비서 '누구'를 서비스하고 있는 SK텔레콤 관계자는 "'누구' 스피커의 음성인식 성능을 개선하기 위해서, 청소기 소리, 설거지 소리 등 다양한 잡음환경, 큰 방, 작은 방, 거실 등 다양한 실내공간환경을 가상으로 모델링해 활용하고 있다"면서 "모델링을 통해 가상으로 생성한 데이터가 실제 상황과 얼마나 비슷한지도 성능에 많은 영향을 주기 때문에, 이런 모델링 기법에 대한 연구도 활발히 진행되고 있다"고 밝혔다. 또 잡음을 직접 제거하는 필터링 기술 연구도 진행중이다.

■바이두, 중국 방언 수집

음성인식 비서 '코타나'를 서비스하는 마이크로소프트(MS)는 소음 속에서 보다 정확하게 주인의 음성을 인식하도록 하기 위해 비디오 게임기 '엑스박스(Xbox)'용 애플리케이션(앱)을 개발해 시장에 내놨다. 이 앱은 엑스박스 사용자들이 영화를 보거나 게임을 즐길 때 나누는 대화를 수집하기 위해 만들어졌다. 또 MS는 공항에서 탑승 안내 방송을 분리하는 기술 시험을 마치고 이를 맥도날드 드라이브스루에 적용했다.

아마존도 '알렉사'의 자동차 적용을 위해 도로 소음과 자동차 창 내리는 소리 등을 분리하는 소음 제거 기술 개발에 한창이다.

바이두는 다양한 지역의 방언이 많이 쓰이는 중국의 특성을 감안, 중국 방언을 수집하기 위한 노력에 한창이다.
지난해 명절 기간에는 전국 각지에서 사용되는 방언을 수집하는 캠페인을 벌이기도했다. 바이두는 2주만에 1000시간 이상 분량의 음성을 녹음하는데 성공했다. 업계 관계자는 "더 많은 데이터들이 축적돼 딥러닝을 지속할수록 인식률은 꾸준히 상승할 것"이라고 내다봤다.

박지영 기자