일본어판 위키백과에 윤동주 시인의 국적이 일본으로 왜곡 표기된 사실이 파악됐다. 서경덕 성신여대 교수가 일본어판 위키백과에 윤동주의 국적을 '일본'으로 소개하고 있다고 8일 밝혔다. 서 교수는 최근 일본 유학생들의 제보를 받아 확인해 본 결과, '윤동주(尹東柱)'를 검색하면 '일본국적의 시인(日本国籍の詩人)'으로 설명하고 있는 것을 확인했다. 서 교수는 "일본어판 위키백과에 윤동주의 국적을 '일본'으로 버젓이 소개하는 것을 바로 잡고자 항의 메일을 보내 수정을 요구한 상황"이라고 말했다. 이어 "윤동주 시인이 일제강점기에 활동한 건 역사적인 팩트"라며 "하지만 그는 '일본인'이 아니라 '한국인'이라는 사실을 전 세계에 제대로 알려야만 한다"고 강조했다. 그러면서 "중국 바이두 백과사전에서도 시인 윤동주의 국적을 '중국(中国)'으로, 민족을 '조선족(朝鮮族)'으로 표기하고 있어 지속적인 항의를 하고 있는 중"이라고 전했다. 서 교수는 "도쿄올림픽 개막을 앞둔 시점에서 '일본 올림픽 박물관'에 전시된 손기정 선수에 대한 소개를 역사적 배경설명 없이 '일본인'으로만 홍보하는 등 왜곡이 더 심해진 상황"이라고 우려했다. 한편 서경덕 교수팀은 중국 및 일본의 역사왜곡에 맞서 대한민국의 역사적 인물에 대한 국적을 올바르게 바로 잡는 '글로벌 한국 역사 홍보 캠페인'을 펼치고 있다. banaffle@fnnews.com 윤홍집 기자
2021-07-08 09:47:22지난 대선을 앞두고 별도의 로그인 없이 누구나 자유롭게 쓰고 수정할 수 있는 인터넷 오픈 백과사전인 '위키백과'에 문재인 대통령과 이재명 경기 성남시장 등을 북한 국적으로 허위 게시한 혐의로 기소된 50대에게 항소심에서도 벌금형이 선고됐다. 서울고법 형사2부(이상주 부장판사)는 23일 공직선거법과 정보통신망 이용촉진 및 정보보호 등에 관한 법률 위반(명예훼손) 혐의로 재판에 넘겨진 사업가 양모씨(53)의 항소심에서 1심과 마찬가지로 벌금 400만원을 선고했다. 재판부는 "게시물 게시 시간이 매우 짧았다 해도 위키백과의 접근성이나 전파 가능성을 고려하면 이 사건 범행으로 피해자들의 명예와 선거에 미칠 부정적 영향이 결코 적다고 할 수 없다"고 판단했다. 지난 2월 양씨는 위키백과에 당시 더불어민주당 경선에 참여한 문 대통령과 이 시장의 국적을 '조선민주주의인민공화국'으로 표기했다. 이에 중앙선관위는 양씨를 검찰에 고발했다. fnljs@fnnews.com 이진석 기자
2017-11-23 10:56:46충남도의 주요정책과 행정정보, 산업인프라, 관광정보 등 모든 정보가 위키백과를 통해 국내외에 정확하고 빠르게 전달된다. 충남도는 19일 도청 접견실에서 안희정 지사와 한국위키미디어협회 이만재 이사장이 참석한 가운데 ‘충남 바로알림을 위한 열린혁신 업무협약’을 체결했다고 밝혔다. 위키백과는 세계적으로 인기 있는 웹사이트 목록 5위를 기록한 지식·정보 공유의 대표적 매체로, 등록 시 구글과 네이버, 다음 검색에 자동 노출된다. 위키백과는 누구든지 인터넷 사이트에 접속해 직접 지식과 정보를 올릴 수 있는 장점이 있는 반면, 관리 주체가 모호해 수록된 행정기관 관련 정보의 양과 질이 매우 미흡한 실정이다. 이에 충남도와 한국위키미디어협회는 이번 협약으로 충남 관련 정보의 위키백과 수록을 통해 도민이 필요한 정보를 보다 쉽고 빠르게 이용할 수 있도록 상호 협력하기로 했다. 협약에 따라 충남도는 행정·산업·관광 등 자료·사진을 확보해 위키백과에 입력하고 기존 외국어 홈페이지 정보와 연계해 영·중·일어 등 외국어로도 공개한다. 한국위키미디어협회는 충남도 위키백과 항목 분석 및 자문, 위키 사용법 교육과 편집자들이 콘텐츠 편집을 위해 함께 모이는 행사인 에디터톤 개최를 지원하는 역할을 맡는다. 특히 전 세계 어디서든 정보를 무료로 공유하고 쉽게 접근할 수 있어 충남도정에 대한 신뢰도 향상 및 이용자 편익증진은 물론, 지역 문화재, 관광, 농특산물, 축제정보 제공으로 관광객 유치에도 큰 도움이 될 것으로 기대된다. 안희정 충남지사는 “앞으로의 행정은 빅데이터를 기반으로 예측 행정, 개인 맞춤형 행정서비스를 구현하는 방향으로 전환하고 있다”면서 “이를 위해서는 다양하고 질 높은 지식·정보의 공유가 바탕이 돼야 한다”고 말했다. kwj5797@fnnews.com 김원준 기자
2017-09-19 13:58:34지난 대선을 앞두고 별도의 로그인 없이 누구나 자유롭게 쓰고 수정할 수 있는 인터넷 오픈 백과사전인 '위키백과'에 문재인 대통령과 이재명 성남시장 등을 북한 국적으로 허위 게시한 혐의로 기소된 50대 남성에게 벌금형이 선고됐다. 2일 법원에 따르면 소프트웨어 개발업체 대표 양모씨(53)는 지난 2월 위키백과에 당시 더불어민주당 경선 예비후보이던 문 대통령과 이 시장의 국적을 '조선민주주의인민공화국'으로 표기했다. 중앙선관위는 이런 사실을 발견하고 양씨를 검찰에 고발했고, 그는 공직선거법과 정보통신망 이용촉진 및 정보보호 등에 관한 법률 위반(명예훼손) 혐의로 재판에 넘겨졌다. 사건을 심리한 서울중앙지법 형사합의21부(조의연 부장판사)는 “위키백과의 접근성이나 전파 가능성, 국내 정치 상황을 고려할 때 피고인이 두 사람의 국적을 조선민주주의인민공화국으로 변경한 것은 사회적 평가를 저하하거나 선거인들에게 종북세력이라는 인식을 심을 수 있는 행위"라며 양씨에게 벌금 400만원을 선고했다. 재판부는 다만 “이런 내용이 명백한 허위라 사람들이 오인할 가능성이 작고, 양씨가 직접 6시간 만에 해당 내용을 수정한 점, 선거에 미친 영향이 적은 점 등을 고려했다”고 양형이유를 설명했다. mountjo@fnnews.com 조상희 기자
2017-09-02 12:00:55더불어민주당 문재인 전 대표 측이 온라인 백과사전인 '위키백과'에 한때 북한 정치인으로 잘못 등재된 것과 관련해 경찰에 수사의뢰를 검토하고 있다. 위키백과는 네티즌이 온라인상에서 자율 편집을 할 수 있어 누군가가 고의로 정보를 고친 것이 아니냐는 의혹을 받고 있다. 위키백과에는 지난달 27일까지 문재인 전 더불어민주당 대표를 검색하면 북한을 뜻하는 "조선민주주의인민공화국의 정치인"이라고 나왔다. 문 전 대표 측은 1일 "누군가가 고의로 정보를 고친 것으로 보인다"며 "조작된 정보가 돌아다닐 경우 심각한 문제가 될 수 있는 사안으로 경찰에 수사를 의뢰하는 방안을 검토 중"이라고 말했다. 위키백과는 또 이재명 성남시장도 한때 '조선민주주의인민공화국 소속 정치인'이라는 설명과 함께 북한의 인공기가 표기됐으나, 현재는 수정된 상태다. 이 밖에도 △전국공무원노조 △전국금속노조 △전국교직원노조 △한국노동조합총연맹(한노총) △전국민주노동조합총연맹(민노총) △전국언론노동조합 등 진보성향 단체들 국적을 모두 '조선민주주의인민공화국'으로 바꿔놓은 것으로 알려졌다. 민주당에선 문 전 대표와 이 시장 등 당내 주자들의 정보가 조작됐다는 점에서 개인의 장난이 아닌 특정세력의 조직적인 움직임이 아니냐는 의혹을 제기하고 있다. 이와 관련해 중앙선관위는 선거법 저촉 여부에 대해 "단순한 허위사실을 넘어 특정 후보자에 대한 당선 또는 낙선 등을 목적으로 한 고의성이 인정돼야 한다"면서 "그러나 위키백과는 네티즌 누구나 자유롭게 수정 가능한 오픈 플랫폼이라는 점에서 현재로서는 고의성이 있다고 보기 어렵다"고 밝혔다. 2001년 미국에서 탄생한 위키백과는 네티즌 누구나 내용 편집을 하도록 해 집단지성 활용을 강점으로 하고 있다. 심형준 기자
2017-03-01 17:25:02더불어민주당 문재인 전 대표측이 온라인 백과사전인 '위키백과'에 한 때 북한 정치인으로 잘못 등재된 것과 관련해 경찰에 수사의뢰를 검토하고 있다. 위키백과는 네티즌이 온라인상에서 자율 편집을 할 수 있어 누군가가 고의로 정보를 고친 것이 아니냐는 의혹을 받고 있다. 위키백과에는 2월 27일까지 문재인 전 더불어민주당 대표를 검색하면 북한을 뜻하는 "조선민주주의인민공화국의 정치인"이라고 나왔다. 문 전 대표 측은 1일 "누군가가 고의로 정보를 고친 것으로 보인다"며 "조작된 정보가 돌아다닐 경우 심각한 문제가 될 수 있는 사안으로 경찰에 수사를 의뢰하는 방안을 검토 중"이라고 말했다. 위키백과는 또 이재명 성남시장도 한 때 '조선민주주의인민공화국 소속 정치인'이라는 설명과 함께 북한의 인공기가 표기됐으나, 현재는 수정된 상태다. 이밖에도 △전국공무원노조 △전국금속노조 △전국교직원노조 △한국노동조합총연맹(한노총) △전국민주노동조합총연맹(민노총) △전국언론노동조합 등 진보 성향 단체들 국적을 모두 '조선민주주의인민공화국'으로 바꿔놓은 것으로 알려졌다. 민주당에선 문 전 대표와 이 시장 등 당내 주자들의 정보가 조작됐다는 점에서 개인의 장난이 아닌 특정세력의 조직적인 움직임이 아니냐는 의혹을 제기하고 있다. 이와 관련해 중앙선관위는 선거법 저촉여부에 대해 "단순한 허위사실을 넘어 특정 후보자에 대한 당선 또는 낙선 등을 목적으로 한 고의성이 인정돼야 한다"면서 "그러나 위키백과는 네티즌 누구나 자유롭게 수정 가능한 오픈 플랫폼이라는 점에서 현재로써는 고의성이 있다고 보기는 어렵다"고 밝혔다. 2001년 미국에서 탄생한 위키백과는 네티즌 누구나 내용 편집을 하도록 해 집단지성 활용을 강점으로 하고 있다. cerju@fnnews.com 심형준 기자
2017-03-01 14:00:00"생성형 인공지능의 강화학습용(트레이닝) 데이터가 적대적 공격을 받는 상황을 블록체인이 막을 수 있다." 3일 서울 광진구 그랜드워커힐 서울에서 열린 코리아블록체인위크(KBW) 메인 컨퍼런스 '임팩트(KBW 2024: IMPACT)'에서 '웹3 생태계의 작은 거인' 이더리움 창시자 비탈릭 부테린(사진)은 이같이 말했다. 부테린은 "지난 2021년 이후 블록체인 기술과 인공지능(AI)의 결합에 대한 굉장히 많은 논의가 있었다"면서 "그 결합이 유의미한지 두 기술의 교집합이 중앙화될지 탈중앙화될지 우리는 이야기해야 한다"고 말했다. 각각의 영역에서 AI와 블록체인(크립토)은 그 중요성이 커지고 있지만 중앙화와 탈중앙화라는 상반된 성격을 갖고 있는 만큼 두 기술의 융합, 즉 교집합에서 어떤 현상이 어떻게 발생할 것인지 면밀하게 살펴야 한다는 지적이다. 또 원장 공개라는 투명성을 내세우는 블록체인과 달리 학습 데이터는 물론 알고리즘조차 불투명한 AI의 결합에 있어 상호 보완할 지점이 많다고 지적했다. 부테린은 AI와 블록체인을 결합하면 △게임 내 플레이어로서의 Al △게임 인터페이스로서의 AI △게임 규칙으로서의 AI △게임의 목표인 AI 등 네 가지 접점이 가능하다고 말했다. 부테린은 "여기서 게임이란 일종의 시스템이자 규칙, 인센티브(보상) 체계, 프로젝트 등을 총괄하는 개념"이라며 "게임 내 플레이어로서 AI가 행위할 수 있도록 하며, 블록체인은 참여자가 따를 수 있는 규칙을 만든다"고 설명했다. 인터페이스로서의 AI 측면에 대해서는 X(트위터)의 커뮤니티 노트 기능을 예시로 설명했다. 현재의 커뮤니티 노트에서도 일종의 위키백과 프로젝트처럼 진실과 거짓에 대한 규명이나 정보 전달이 이뤄지고 있다. 여기에 크립토를 활용한 보상이 적용되면 현재의 느리고 비싼 정보전달 방식이 보다 저렴하고 빠르게 이뤄질 수 있다. 또 이 과정에서 AI가 활용된다. 부테린은 "예를 들어 '누군가 부테린은 마술을 숭배한다'는 글을 올렸을 때 1센트의 보상으로 이것이 사실이 아니라는 댓글(커뮤니티 노트)이 달릴 것"이라며 "이는 증빙이자 일종의 자정작용"이라고 설명했다. 그는 거대언어모델(LLM) 생성형 AI의 약점으로 꼽히는 '가짜뉴스' 관련 학습이나 문화 편향도 크립토를 활용해 극복할 수 있을 것으로 전망했다. 부테린은 "게임에서 AI 심판, AI 규칙 판단관이 있다고 한다면 AI의 학습 데이터에 기초한 바이러스(오류)가 미국·백인 편향 방식으로 발생할 수 있다"면서 "학습용 데이터가 불투명하다면 AI의 판단도 불투명할 것"이라고 말했다. 그는 "블록체인 기술을 활용한 보안을 강화해 이를 해결할 수 있다"고 주장했다. 예를 들어 안면인식 AI는 마스크나 빨간색 뿔테안경을 쓴 얼굴을 인식하지 못한다. AI에게 다양한 색깔의 마스크와 안경 데이터를 10억회 이상 학습시키면 얼굴을 인식해내겠지만, 학습용 데이터가 공개돼있다면 적대적 공격의 대상이 될 수 있다. 하지만 학습용 데이터에 프라이빗한 블록체인 결합을 통해 투명성을 확보한다면 이 문제를 해결할 수 있다는 주장이다. 부테린은 "블록체인의 암호화 기술은 인공지능이 학습과 추론 작업을 할 때 프라이버시를 유지하면서도 가능하게 한다"면서 "학습용 데이터, 프로세스(알고리즘) 모두를 효율적으로 만들 수 있다"고 강조했다. 그는 민주주의적 거버넌스를 통해 트레이닝 데이터에 어떠한 데이터가 들어가는지도 결정할 수 있다고 밝혔다. AI의 결정이 미국, 백인, 특정 개발자의 사고 알고리즘으로부터 벗어날 수 없다는 경고가 이어지는 가운데 블록체인과의 결합을 통해 이를 극복할 수 있다는 지적이다. 고려대 블록체인학회 '블록체인밸리' 소속으로 키노트 현장을 찾은 박성훈씨와 정건우씨는 "부테린의 지적에 공감한다며 학습용 데이터에 블록체인으로 일반적으로 드러나지 않는 꼬리표를 다는 방식으로 해결한 사례가 이미 있다"면서 "이미지 생성형 AI의 저작권 침해 문제 해결을 위해 학습용 데이터에 꼬리표를 다는 방식"이라고 말했다. AI의 불투명성 문제 해결을 위한 블록체인 기술 활용 가능성에 공감한 것이다. 부테린은 "블록체인 측에서도 AI를 도입하면 이는 정당하고 합리적이어야 한다"면서 "인공지능이 실제로 필요한건지, 도입했을 때 보안이 유지될 수 있는지, 앱에서 내가 원하는 것이 구현되는 것인지 확인해볼 필요가 있다"고 설명했다. 실제 수많은 앱이 두 기술을 결합했다고 주장했지만 따로 노는 경우가 많다는 것. 그는 "크립토 AI 앱 중 온체인에서 데이터 퍼블리싱을 하거나 트레이닝 데이터를 해시한 것뿐인 경우가 많다"면서 "어떤 보안적 노력이 있는지 확실히 해야한다"고 덧붙였다. 부테린은 "앱을 만들 때 인공지능, 블록체인 요소를 모두 넣을 때 어떤 기술적 강력한 스토리를 갖게 되는지, 둘이 정확히 결합됐는지 사용자에게 설명해야 한다"면서 "이 조건을 만족할 때 강력하고 엄청난 일을 할 수 있을 것"이라고 말했다.
2024-09-03 18:35:04[파이낸셜뉴스] "생성형 인공지능의 강화학습용(트레이닝) 데이터가 적대적 공격을 받는 상황을 블록체인이 막을 수 있다." 3일 서울 광진구 그랜드워커힐 서울에서 열린 코리아블록체인위크(KBW) 메인 컨퍼런스 ‘임팩트(KBW 2024: IMPACT)’에서 ‘웹3 생태계의 작은 거인’ 이더리움 창시자 비탈릭 부테린은 이같이 말했다. 비탈릭은 "지난 2021년 이후 블록체인 기술과 인공지능(AI)의 결합에 대한 굉장히 많은 논의가 있었다"면서 "그 결합이 유의미한지 두 기술의 교집합이 중앙화될지 탈중앙화될지 우리는 이야기해야한다"고 말했다. 각각의 영역에서 AI와 블록체인(크립토)은 그 중요성이 커지고 있지만 중앙화와 탈중앙화라는 상반된 성격을 갖고 있는 만큼 두 기술의 융합 즉 교집합에서 어떤 현상이 어떻게 발생할 것인지 면밀하게 살펴야한다는 지적이다. 또 원장의 공개라는 투명성을 내세우는 블록체인과 달리 학습 데이터는 물론 알고리즘조차 불투명한 AI의 결합에 있어 상호 보완할 지점이 많다고 지적했다. 비탈릭은 AI와 블록체인을 결합하면 △게임 내 플레이어로서의 Al △게임 인터페이스로서의 AI △게임 규칙으로서의 AI △게임의 목표인 AI 등 네가지 접점이 가능하다고 말했다. 비탈릭은 "여기서 게임이란 일종의 시스템이자 규칙, 인센티브(보상) 체계, 프로젝트 등을 총괄하는 개념"이라며 "게임 내 플레이어로서 AI가 행위할 수 있도록 하며, 블록체인은 참여자가 따를 수 있는 규칙을 만든다"고 설명했다. 인터페이스로서의 AI 측면에 대해서는 X(트위터)의 커뮤니티 노트 기능을 예시로 설명했다. 현재의 커뮤니티 노트에서도 일종의 위키백과 프로젝트처럼 진실과 거짓에 대한 규명이나 정보 전달이 이뤄지고 있다. 여기에 크립토를 활용한 보상이 적용되면 현재의 느리고 비싼 정보전달방식이 보다 저렴하고 빠르게 이뤄질 수 있다. 또 이 과정에서 AI가 활용된다. 비탈릭은 "예를 들어 '누군가 비탈릭은 마술을 숭배한다'는 글을 올렸을 때 1센트의 보상으로 이것이 사실이 아니라는 댓글(커뮤니티 노트)이 달릴 것"이라며 "이는 증빙이자 일종의 자정작용"이라고 설명했다. 그는 거대언어모델(LLM) 생성형 AI의 약점으로 꼽히는 '가짜 뉴스' 관련 학습이나 문화 편향도 크립토를 활용해 극복할 수 있을 것으로 전망했다. 비탈릭은 "게임에서 AI 심판, AI 규칙 판단관이 있다고 한다면 AI의 학습 데이터에 기초한 바이러스(오류)가 미국·백인 편향 방식으로 발생할 수 있다"면서 "학습용 데이터가 불투명하다면 AI의 판단도 불투명할 것"이라고 말했다. 그는 "블록체인 기술을 활용한 보안을 강화해 이를 해결할 수 있다"고 주장했다. 예를 들어 안면인식 AI는 마스크나 빨간색 뿔테 안경을 쓴 얼굴을 인식하지 못한다. AI에게 다양한 색깔의 마스크와 안경 데이터를 10억회 이상 학습시키면 얼굴을 인식해내겠지만, 학습용 데이터가 공개돼있다면 적대적 공격의 대상이 될 수 있다. 하지만 학습용 데이터에 프라이빗한 블록체인 결합을 통해 투명성을 확보한다면 이 문제를 해결할 수 있다는 주장이다. 비탈릭은 "블록체인의 암호화 기술은 인공지능이 학습과 추론 작업을 할 때 프라이버시를 유지하면서도 가능하게 한다"면서 "학습용 데이터, 프로세스(알고리즘) 모두를 효율적으로 만들 수 있다"고 강조했다. 그는 민주주의적 거버넌스를 통해 트레이닝 데이터에 어떠한 데이터가 들어가는지도 결정할 수 있다고 밝혔다. AI의 결정이 미국, 백인, 특정 개발자의 사고 알고리즘으로부터 벗어날 수 없다는 경고가 이어지는 가운데 블록체인과의 결합을 통해 이를 극복할 수 있다는 지적이다. 고려대 블록체인학회 '블록체인밸리' 소속으로 키노트 현장을 찾은 박성훈씨와 정건우씨는 "비탈릭의 지적에 공감한다며 학습용 데이터에 블록체인으로 일반적으로 드러나지 않는 꼬리표를 다는 방식으로 해결한 사례가 이미 있다"면서 "이미지 생성형 AI의 저작권 침해 문제 해결을 위해 학습용 데이터에 꼬리표를 다는 방식"이라고 말했다. AI의 불투명성 문제 해결을 위한 블록체인 기술 활용 가능성에 공감한 것이다. 비탈릭은 "블록체인 측에서도 AI를 도입하면 이는 정당하고 합리적이어야 한다”면서 “인공지능이 실제로 필요한건지, 도입했을 때 보안이 유지될 수 있는지, 앱에서 내가 원하는 것이 구현되는 것인지 확인해볼 필요가 있다"고 설명했다. 실제 수많은 앱이 두 기술을 결합했다고 주장했지만 따로 노는 경우가 많다는 것. 그는 "크립토 AI 앱 중 온체인에서 데이터 퍼블리싱을 하거나 트레이닝 데이터를 해시한 것 뿐인 경우가 많다"면서 "어떤 보안적 노력이 있는지 확실히 해야한다"고 덧붙였다. 비탈릭은 "앱을 만들 때 인공지능, 블록체인 요소를 모두 넣을 때 어떤 기술적 강력한 스토리를 갖게 되는지, 둘이 정확히 결합됐는지 사용자에게 설명해야 한다"면서 "이 조건을 만족할 때 강력하고 엄청난 일을 할 수 있을 것"이라고 말했다. mj@fnnews.com 박문수 김미희 한영준 박지연 노유정 기자
2024-09-03 16:38:13생성형 인공지능(AI) 모델 개발 시 활용되는 '인터넷상 공개 데이터'를 안전하게 처리할 수 있는 정부 차원의 기준이 나왔다. 개인정보보호위원회는 AI 개발에 필수적인 공개 데이터를 적법하고 안전하게 처리하는 기준이 될 '인공지능(AI) 개발·서비스를 위한 공개된 개인정보 처리 안내서'를 마련해 17일 공개했다. 생성형AI가 폭발적으로 성장하면서 광범위한 데이터 학습이 필수가 됐다. 공개 데이터는 사진, 게시물, 영상 등 인터넷 상 누구나 합법적으로 접근할 수 있는 데이터로 생성형AI 개발을 위한 학습의 핵심 요소다. AI 기업들은 커먼크롤, 위키백과, 블로그, 웹사이트 등에 있는 공개 데이터를 웹 스크래핑 등의 방식으로 수집해 AI 학습데이터로 활용하고 있다. 조윤주 기자
2024-07-17 18:25:05[파이낸셜뉴스] 생성형 인공지능(AI) 모델 개발 시 활용되는 ‘인터넷상 공개 데이터’를 안전하게 처리할 수 있는 정부 차원의 기준이 나왔다. 개인정보보호위원회는 AI 개발에 필수적인 공개 데이터를 적법하고 안전하게 처리하는 기준이 될 '인공지능(AI) 개발·서비스를 위한 공개된 개인정보 처리 안내서'를 마련해 17일 공개했다. 생성형AI가 폭발적으로 성장하면서 광범위한 데이터 학습이 필수가 됐다. 공개 데이터는 사진, 게시물, 영상 등 인터넷 상 누구나 합법적으로 접근할 수 있는 데이터로 생성형AI 개발을 위한 학습의 핵심 요소다. AI 기업들은 커먼크롤, 위키백과, 블로그, 웹사이트 등에 있는 공개 데이터를 웹 스크래핑 등의 방식으로 수집해 AI 학습데이터로 활용하고 있다. 다만 이러한 공개 데이터에는 주소나 주민등록번호 등의 고유식별번호, 신용카드 번호 등 여러 개인정보가 포함될 수 있다는 우려가 컸다. 개인정보위는 현행 개인정보보호법에는 이러한 공개 개인정보 처리에 적용될 수 있는 명확한 기준이 없어, 기업이 참고할 수 있는 최소한의 기준을 제시하는 안내서를 마련하게 됐다고 전했다. 즉, 공개된 개인정보 수집·활용의 법적기준을 명확하게 하고, AI 개발 및 서비스 단계에서 어떤 안전조치를 취하는 것이 적정한지에 대한 최소한의 기준이라는 의미다. 개인정보위는 "공개된 개인정보를 활용하는 기업들의 개인정보 침해 이슈를 최소화하는 동시에 법적 불확실성을 해소해 기업의 혁신성장을 돕겠다는 취지"라고 설명했다. 안내서에 따르면 개인정보보호법에 따른 '정당한 이익' 조항에 의해 공개된 개인정보만 AI 학습·서비스 개발에 활용할 수 있다. '정당한 이익'은 개인정보 처리자의 정당한 이익을 달성하기 위해 필요한 경우로 명백하게 정보주체의 권리보다 우선하는 경우를 말한다. 특히 기업이 '정당한 이익' 조항에 걸맞게 공개 데이터를 활용하려면 AI 개발 목적의 정당성을 갖춰야 하고, 개발 취지와 관련없는 개인정보를 AI 학습에서 배제하는 등 정보 처리에 합리성이 부여되어야 한다. 또 정보주체 권리침해 방지를 위한 안전성 확보 조치를 마련하는 등 3가지 요건을 충족해야 한다는 점도 분명히 했다. yjjoe@fnnews.com 조윤주 기자
2024-07-17 14:28:14