IT >

AI 학습용 개인정보 처리... 정부, 첫 가이드라인 마련

생성형 인공지능(AI) 모델 개발 시 활용되는 '인터넷상 공개 데이터'를 안전하게 처리할 수 있는 정부 차원의 기준이 나왔다.

개인정보보호위원회는 AI 개발에 필수적인 공개 데이터를 적법하고 안전하게 처리하는 기준이 될 '인공지능(AI) 개발·서비스를 위한 공개된 개인정보 처리 안내서'를 마련해 17일 공개했다.


생성형AI가 폭발적으로 성장하면서 광범위한 데이터 학습이 필수가 됐다. 공개 데이터는 사진, 게시물, 영상 등 인터넷 상 누구나 합법적으로 접근할 수 있는 데이터로 생성형AI 개발을 위한 학습의 핵심 요소다. AI 기업들은 커먼크롤, 위키백과, 블로그, 웹사이트 등에 있는 공개 데이터를 웹 스크래핑 등의 방식으로 수집해 AI 학습데이터로 활용하고 있다.

조윤주 기자