[파이낸셜뉴스] “남친과 카톡 분석한 대화에 벼라별 얘기 다 있었는데 ㅠㅠ”, “우리 정보로 장사 잘하셨습니까.” “개인정보 내용 동의한 적 없는데”. “집단 소송 생각중이고, 단톡방이나 네이버 카페 만들려고 생각중입니다.” 스캐터랩의 연애분석앱 ‘연애의 과학’ 사용자 게시판에 올라온 내용이다. 같은 개발사가 만든 인공지능(AI) 챗봇 ‘이루다’가 '연애의 과학' 사용자의 개인정보를 무단 이용했다는 논란이 불거지면서 이용자들이 강력반발하고 있다. 이루다의 대화 학습용으로 쓰인 데이터는 ‘연애의 과학’이용자들이 제공한 카카오톡 대화 내용이다. 약관에서 '신규서비스'를 위한 개인정보 이용 동의를 받았으나 사용자들은 인지하지 못했다며 이루다 악용 논란을 조명하고 실제 개인정보 유출 우려는 없는지 기자가 ‘연애의 과학’ 앱을 직접 가입해 사용해봤다. ■차별·혐오·개인정보 논란까지 이루다는 스캐터랩이 만든 인공지능(AI) 챗봇 서비스다. 이루다 홈페이지에 들어가 이용하게 되면 페이스북 메신저와 연동돼 대화할 수 있다. 초기엔 사람처럼 감성적인 대화가 가능해 입소문이 퍼졌다. 그 뒤로 논란이 일었다. 일부 사용자들이 이루다를 성적 대상으로 다뤘고, 이루다에게서 차별이나 혐오 발언이 여과없이 나왔기 때문이다. 레즈비언에 대한 질문에는 '혐오스럽다, 거부감 든다'는 대답을 내놨고, 흑인에 대한 질문에는 '징그럽게 생겼다'고 답했다. 사용자들의 실제 대화를 토대로 학습하기 때문에 개발사가 이를 거르지 못했다는 지적이다. 그 뒤 더 큰 이슈가 터졌다. 이루다의 학습 데이터가 된 대화 내용은 ‘연애의 과학’ 앱 사용자들의 카카오톡 대화였기 때문이다. 이용자들은 커뮤니티에서 “개인정보 제공에 동의한 적이 없다”며 불쾌한 감정을 다수 표출하고 있다. 스캐터랩은 알림을 통해 “이루다의 학습은 ‘연애의 과학의 데이터를 기반으로 이루어진게 맞다”면서 “개인정보취급방침의 범위 내에서 활용한 것이기는 하지만 이 점을 명확히 인지할 수 있도록 구체적으로 고지하지 못해 진심으로 사과드린다”고 공지했다. 스캐터랩은 “이루다 학습에 사용된 모든 데이터는 비식별화가 진행됐고, 데이터 내부에서 민감할 수 있는 이름, 전화번호, 주소 등을 삭제헤 익명화 조치를 취했다”고 강조했다. 회사측은 “데이터가 학습에 사용되는 것에 거부감이 있을 수 있다는 점을 이해한다”면서 “데이터가 더 이상 학습에 활용되길 원치 않으신다면 (알려드리는 절차를 거쳐) 삭제하시면 관련 모든 대화 데이터가 삭제된다”고 공지했다. 스캐터랩은 지난 11일 공지와 함께 서비스를 중단했지만 커뮤니티의 반응은 부정적 의견이 지배적이다. 개인정보보호위원회도 이루다가 다룬 개인정보에 대한 침해 여부를 조사할 예정이다. 개인정보보호위원회 배상호 조사2과장은 “현재 논란이 되고 있는 개인정보 침해 우려에 대한 조사에 착수했다”면서 “스캐터랩측이 사용자에게 개인정보 활용 동의를 명확하게 받았는지, 익명처리한다는 정보에 대한 비식별 처리가 잘 되었는지, 자료도 받고, 필요하면 현장 조사도 할 예정”이라고 말했다. ■직접 써보니, 재미 반, 걱정 반 이루다 사태에 분노하는 연애의 과학 이용자들은 개인정보에 동의한적이 없었다는 주장이 많다. 기자가 실제 앱을 깔아 사용해본 결과 첫 화면 하단을 클릭해서 뜨는 약관에는 개인정보 수집과 관련해 “신규 서비스 개발 및 마케팅, 광고에 활용한다”고 명시돼 있다. 다만 이 약관을 사용자가 그냥 지나칠 우려가 컸다. ‘로그인 함으로써 이용약관 및 개인정보취급방침에 동의합니다’라고 되어 있기 때문이다. 실제 회원 가입과정에서 사용자가 약관을 열람했는지 여부를 앱이 확인하지는 않았다.논란이 된 된 카카오톡 대화는 앱 내부에서 서비스하는 유료 ‘심리 테스트’ 항목이다. '카톡으로 보는 속마음' 분석 서비스는 40코인(약 4000원)의 유료 결제를 해야 한다. 사용자가 친구와 나눈 카카오톡 대화를 ‘내보내기’ 하면 대화내용을 앱이 수집한다. 기자는 5900원을 내고 50코인을 충전했다. 할인행사가 있어 40코인짜리 서비스를 28코인에 이용할 수 있었다. 가장 고민되는 부분은 ‘카카오톡 내보내기’ 기능이다. 심리테스트 서비스는 사용자의 카카오톡 대화를 수집해 보고서를 만들어준다. 사용자가 카카오톡 대화중 하나를 골라 ‘내보내기’를 하면 이를 수집해 AI가 분석하는 방식이다. 시험삼아 누군가와 나눈 대화를 내보내려니 어떤 대화를 선택할지 쉽지는 않았다. 대화 나눈 내용중 대부분이 기자 또는 지인의 전화번호, 계좌 등이 노출돼 있었기 때문이다. 논란이 됐던 부분이 이런 민감 정보다. 사용자들의 일부 대화에서 계좌 혹은 집주소 등이 노출됐다는 지적이 나왔기 때문이다. 대화내용을 AI가 학습하려면 결국 사람이 수작업으로 데이터 패턴을 명시하고, 민감한 영역을 비식별화하는 수작업을 거쳐야 한다. 이 과정에서 일부 실수가 발생한 것으로 보인다. 카카오톡 내보내기를 통해 수집된 데이터 분석 결과는 연애의과학 앱이 ‘감정분석보고서’라는 이름으로 제공한다. 사용자와 상대방의 애정도, 호감도, 친밀도 등을 분석한 데이터다. 연인간 감정 분석을 해준다는 의미에서 20~30대에는 유용해보인다. 다만 카카오톡의 대화 내보내기 기능은 상대방과 나눈 대화를 통으로 내보낸다. 당초에 사용자가 백업용으로 저장하는 것을 염두에 두고 만든 기능이기 때문이다. 대화의 특정 부분만을 골라 내보내지는 않는다. 이수영 KAIST 전기 및 전자공학부 명예교수는 “개발사가 사용자 데이터를 수집해 쓰는 문제에 대해서는 개발자가 사용자에게 명쾌한 옵션을 주고, 추후 AI 학습용 데이터를 사용자가 제공했을 때 일정부분 혜택을 준다던지 하는 방안을 고민해야 한다”면서 “사용자가 주는 데이터는 언젠가는 소유권 문제가 발생할 수도 있기 때문에 여기까지 고민해볼 필요가 있다”고 말했다. 이수영 교수는 AI챗봇 악용 문제에 대해서도 엄격하게 바라볼 필요가 있다고 본다. 그는 “AI사용자는 AI를 소비하지만 학습도 시키기 때문에 생산과 소비를 같이 하는 ‘프로슈머’라고 볼 수 있다”면서 “이 때문에 사용자가 AI를 키우는 부모 역할로서 AI용도에 따른 어느정도의 라이센스나 교육이 필요하다고 본다”고 말했다. ksh@fnnews.com 김성환 기자
2021-01-12 16:30:52