LG가 이미지를 분석해 인간처럼 문장으로 설명하고 핵심 키워드까지 제공하는 이미지 검색분야 생성형 인공지능(AI) 상용화에 나섰다. LG AI연구원이 공개한 '캡셔닝 AI'는 5개 문장과 10개의 키워드를 10초 만에 생성할 수 있어 대량의 이미지를 관리해야 하는 기업들의 업무효율성과 생산성을 높일 것으로 기대된다.LG AI연구원은 18일(이하 현지시간) 캐나다 밴쿠버에서 열린 세계 최대 컴퓨터비전학회 'CVPR(컴퓨터 비전과 패턴 인식) 2023'에 참가해 캡셔닝 AI를 최초 공개했다. CVPR은 세계 최대 기술전문단체인 전기전자공학자협회(IEEE)와 컴퓨터비전협회(CVF)가 공동주최하는 세계 최대 규모의 학술대회다. 비전 AI 분야의 대표적 학회이자 컴퓨터공학에서 가장 영향력 있는 학회로 꼽힌다. 캡셔닝 AI는 최근 화두가 되고 있는 챗GPT(대화형 생성 AI)나 스테이블 디퓨전, 미드저니(이미지 생성 AI)와 달리 이미지 검색 시장을 타깃으로 개발됐다. LG AI연구원 관계자는 "인간처럼 처음 보는 이미지까지 자연어로 설명할 수 있는 AI"라고 강조했다. 캡셔닝 AI는 이미지를 입력만 하면 "스파클러로 별모양을 그리고 있는 어린아이" "라벤더 들판에 '소풍은 사절합니다. 감사합니다'라고 안내되어 있다" 등의 문장을 표현한다. 설정마다 다르지만 평균적으로 10초 이내에 5개 문장과 10개의 키워드를 생성한다. 이미지 범위를 1만장으로 확장하면 2일 이내에 작업을 마칠 수 있다. 맞춤형 이미지 검색·관리 시스템을 구축해 대량의 이미지를 관리해야 하는 기업들의 업무효율성과 생산성을 높일 수 있는 것으로 기대되는 대목이다. LG AI연구원과 데이터 학습과 서비스 개발까지 함께한 세잘 아민 셔터스톡 최고기술책임자(CTO)는 "지난달 상용화 서비스를 시작해 글로벌 고객사 10곳을 대상으로 '얼리 액세스(앞서 해보기)'를 진행하며 기술을 발전시켜 나가고 있다"며 "캡셔닝 AI는 고객들이 반복적인 작업보다 좀 더 본질적이고 창의적인 일에 집중할 수 있도록 돕는 AI가 될 것"이라고 밝혔다. 특히 LG AI연구원과 셔터스톡은 실용적이면서도 신뢰할 수 있는 AI 모델 개발을 위해 학습 데이터의 편향성·선정성 등 윤리 검증을 진행해 저작권 투명성도 확보했다. 한편 LG AI연구원은 이번 공개와 맞물려 22일까지 진행되는 학회 기간에 LG전자, LG이노텍, LG에너지솔루션, LG유플러스 등 계열사와 함께 글로벌 AI 우수인재 확보에도 나선다. 이를 위해 학회에 참가한 석·박사 학생들을 대상으로 네트워킹 행사인 'LG AI DAY'를 진행한다. hoya0222@fnnews.com 김동호 최종근 기자
2023-06-19 19:33:46【 서울·밴쿠버(캐나다)=김만기 기자 한국과학기자협회 공동취재단】 한국과학기술원(KAIST) 연구팀이 사람처럼 학습한 적 없는 이미지나 영상을 읽어내는 생성형 인공지능(AI) 모델을 개발해 전세계 142개 팀과 겨뤄 2위를 차지했다. LG AI연구원이 세계 최대 컴퓨터 비전 학회 'CVPR'을 앞두고 18일(현지시간) 캐나다 밴쿠버 컨벤션센터에서 '제로샷 이미지 캡셔닝'을 주제로 워크숍을 개최했다. 이날 워크숍에서는 올 2~4월 진행된 'LG 글로벌 AI 챌린지'에서 2위를 차지한 KAIST 연구팀의 오영택 전기및전자공학부 박사과정생의 수상자 발표가 진행됐다. 올해 처음 개최한 이번 챌린지에 전 세계 총 142개 연구팀이 참여한 가운데 중국 난징과기대 연구팀과 한국 KAIST 연구팀이 각각 1·2위를 차지했다. 또 카카오브레인과 우리은행 연구팀이 3·4위를 각각 차지했다. LG AI연구원은 국제전기전자공학회(IEEE)가 개최하는 'CVPR'에서 연구 분야 성숙도가 일정수준 이상 될 때까지 수년간 이어가는 경우가 많은 만큼 이번 워크숍을 시작으로 이미지 캡셔닝 분야 연구를 주도해 나갈 방침이다. 난징과기대 연구진은 이미지 캡셔닝 AI모델의 이미지 이해력을 높이기 위해 유사한 내용을 담고 있는 참조 데이터를 대규모 학습시켜 AI 모델의 정확도에서 가장 높은 점수를 얻어 우승을 차지했다.
2023-06-19 19:25:56【 서울·밴쿠버(캐나다)=김만기 기자 한국과학기자협회 공동취재단】 이경무 서울대학교 전기정보공학부 석좌교수(사진)는 18일(현지시간) 캐나다 밴쿠버 컨벤션센터에서 열리는 '국제 컴퓨터 비전 및 패턴 인식 학회(CVPR) 2023'을 앞두고 LG AI연구원의 캡셔닝 AI를 언급하면서 "AI 특화 분야를 적극 연구하면 초거대 AI 시대 경쟁 환경에서 살아남는 전략이 될 수 있다"고 말했다. 이날 LG가 CVPR에서 주최한 이미지 캡셔닝 AI 워크숍에도 "경쟁이 치열한 CVPR에서 특화 분야 워크숍을 여는 건 분야를 이끌고 있다는 걸 인정받는 것"이라고 평가했다. 이 교수는 이미지를 판별하고 설명하는 '이미지 캡셔닝' AI의 중요성에 대해 "로봇이 사람처럼 활동하고 해석하려면 시각 정보를 사람이 인지할 수 있는 언어로 표현할 수 있느냐가 가장 중요한 문제"라고 강조했다. 이는 사람이 인지활동을 할 때 뇌가 외부로부터 받는 정보 중 90%가 시각이다. 이는 시각정보를 해석하고 인지하지 못하면 진정한 AI를 만들기가 어렵다는 뜻이다. 이 교수는 "시각적 정보를 통해 어떤 물체가 있는지를 포함해 물체의 상태, 물체 간 관계성, 예측 등을 모두 추론할 수 있다"고 말했다. 그는 "LG 초거대AI '엑사원'은 다른 빅테크 기업들이 언어에 중점을 가진 것과 달리 시각정보에 특화돼 있어 챗GPT 같은 AI가 갖지 못한 장점을 가지고 있다"며 "영상을 설명하는 캡셔닝 기술 등 도전적 문제들을 풀고 있다"고 설명했다. 그는 "챗GPT처럼 엄청난 자원을 투입한 AI도 미국 내에서 구글이나 마이크로소프트 등과 경쟁하기 쉽지 않다는 관측이 있을 정도"라면서 "범용AI 분야는 그만큼 자원을 투입하고도 이점이 불확실한 상황인 만큼 특화전략을 펼칠 필요가 있다는 것"이라고 설명했다. 이 교수는 이런 전략을 거쳐 장기적으로 시각과 언어 등 여러 정보를 동시에 처리하는 '멀티모달 AI'와 '임베디드 AI 기술' 등으로 연구를 확대할 필요가 있다고 내다봤다. 그는 "다양한 정보로 판단을 내리는 종합적 AI를 개발하려면 우리 뇌처럼 하나의 시스템이 모든 걸 다 할 수 있도록 하는 '멀티모달 레이어' 기술이 추후 핵심이 될 것"이라며 "또 로봇과 같은 실제 물리적 시스템에서 AI가 활용돼야 하는 만큼 시스템에서 바로 AI를 활용할 수 있도록 내재해야 실용적인 기술이 될 것"이라고 전망했다.
2023-06-19 19:25:41【 서울·밴쿠버(캐나다)=김만기 기자 한국과학기자협회 공동취재단】 세계 인공지능(AI) 전문가들은 AI가 정교하고 정확하게 이미지를 자연어로 만들게 하려면 맥락을 파악하고 지식을 늘리는 학습이 필요하다고 지적했다. 또 AI가 내놓은 결과물의 평가 문제점을 지적하며 한계를 극복하기 위한 노력에 대해서도 논의했다. LG AI연구원은 캐나다 밴쿠버 컨벤션센터에서 20~22일 열리는 세계 최대 컴퓨터 비전 학회 'CVPR 2023'에 앞서 18일(현지시간) 이미지에서 캡션과 키워드를 생성하는 '캡셔닝 AI'를 공개했다. LG AI연구원은 '캡셔닝 AI'의 기반기술인 '제로샷 이미지 캡셔닝'을 주제로 워크숍도 개최했다. 강연자로 참석한 글로벌 전문가들은 이미지 캡셔닝 AI모델을 보다 진보시키기 위한 기술적 과제가 필요하다는 목소리를 냈다. ■맥락·지식 학습량 더 늘려야애나 로르바흐 미국 버클리 캘리포니아대(UC버클리) 리서치 연구원은 AI가 이미지를 이해하고 대표성을 확보한 설명을 만들어내려면 '맥락' 선택이 중요하다고 강조했다. 로르바흐 연구원은 "특히 뉴스의 경우 뉴스 사진설명을 AI가 생성하려면 기사 내 데이터 문맥을 잘 선택하는 게 중요하다"며 "통상적으로 캡션은 일부 문장에 의해서 만들어지기 때문"이라고 말했다. 또 "이미지 캡셔닝 AI의 대표적인 문제로 꼽히는 '환각(Hallucination)'을 줄이는 기술도 필요하다"고 강조했다. AI 분야에서 환각은 AI가 주어진 데이터 또는 맥락에 근거하지 않은 잘못된 정보를 생성하는 경우를 말한다. 거짓을 마치 사실처럼 제시하는 경우다. 코르델리아 슈미드 프랑스 국립컴퓨터과학연구소 연구책임자 겸 구글 리서치 프랑스 연구원은 '위키피디아' 내 정보와 사진을 검색하며 지식을 늘려가는 방식으로 대규모 메모리를 만드는 이미지 캡셔닝 전략을 소개했다. 이를 활용하면 사진을 보고 지식이 필요한 질문을 할 때 컴퓨터가 정보를 빠르게 검색하고 답할 수 있다. 슈미드 연구원은 "이런 방식으로 대규모 지식을 축적하면 시각적 질문에 대한 답변뿐 아니라 이미지 캡셔닝에서도 최고 성능을 얻을 수 있다"고 말했다. 그는 영상 인식에서는 화면 해설이 담긴 유튜브 영상 1500만개를 학습하는 방식으로 사건이 일어나는 기간과 설명을 동시에 파악하는 방식을 적용한 모델 'Vid2Seq'도 소개했다. 그는 "영상을 쪼개 사건을 파악하는 것은 사건 간 연결이 어렵다"며 "사건에 시간 정보를 부여하면 다양한 사건이 일어나는 고밀도 영상도 설명을 만들어낼 수 있다"고 설명했다. ■"AI 추론 가능…더 정교해져야"하미드 팔랑기 마이크로소프트 리서치 수석연구원 겸 워싱턴대 교수는 맥락을 언급하며 '이미지 캡셔닝 평가의 어려움'을 주제로 발표했다. 팔랑기 교수는 "AI가 생성한 이미지 캡션의 맥락은 이해하기 어렵고 복잡하다"며 "이미지 캡셔닝 평가가 어려운 이유는 AI 언어 모델 자체의 문제일 수도 있고, 데이터나 다른 기능 등 다방면에서 문제가 발생할 수 있기 때문"이라고 말했다. 그러면서 "이는 모든 AI 연구자들이 함께 풀어야 하는 문제"라며서 "더 정교한 AI 모델을 만들기 위해 더 많은 문제제기가 필요하다"고 주장했다. 잭 헤셀 미국 앨런인공지능연구소 연구원도 이미지 캡셔닝의 성능을 높이려면 AI가 상식을 뛰어넘는 추론을 할 수 있도록 정교해져야 한다고 강조했다. 헤셀 연구원은 "대규모 어휘를 학습한 모델도 전체적인 장면 이해에 필요한 요소가 상식에 맞지 않아 놓치는 경우가 많다"며 "현상을 관찰해 가장 설득적인 설명을 만드는 귀추법 등을 적용할 필요가 있다"고 설명했다. monarch@fnnews.com
2023-06-19 19:25:38[파이낸셜뉴스] LG가 이미지를 분석해 인간처럼 문장으로 설명하고 핵심 키워드까지 제공하는 이미지 검색 분야 생성형 인공지능(AI) 상용화에 나섰다. LG AI연구원이 공개한 '캡셔닝 AI'는 5개 문장과 10개의 키워드를 10초 만에 생성할 수 있어,대량의 이미지를 관리해야 하는 기업들의 업무 효율성과 생산성을 높일 것으로 기대된다. LG AI연구원은 18일(이하 현지시간) 캐나다 밴쿠버에서 열린 세계 최대 컴퓨터비전학회 'CVPR(컴퓨터 비전과 패턴 인식) 2023'에 참가해 캡셔닝 AI를 최초 공개했다. CVPR은 세계 최대 기술 전문 단체인 전기전자공학자협회(IEEE)와 컴퓨터비전협회(CVF)가 공동 주최하는 세계 최대 규모의 학술대회다. 비전 AI 분야의 대표적 학회이자 컴퓨터 공학에서 가장 영향력 있는 학회로 꼽힌다. 캡셔닝 AI는 최근 화두가 되고 있는 챗GPT(대화형 생성 AI)나 스테이블 디퓨전·미드저니(이미지 생성 AI)와 달리 이미지 검색 시장을 타깃으로 개발됐다. LG AI연구원 관계자는 "인간처럼 처음 보는 이미지까지 자연어로 설명할 수 있는 AI"라고 강조했다. 캡셔닝 AI는 이미지를 입력만 하면 "스파클러로 별모양을 그리고 있는 어린 아이", "라벤더 들판에 '소풍은 사절합니다. 감사합니다'라고 안내되어 있다" 등의 문장을 표현한다. 설정마다 다르지만 평균적으로 10초 이내에 5개 문장과 10개의 키워드를 생성한다. 이미지 범위를 1만장으로 확장하면 2일 이내에 작업을 마칠 수 있다. 맞춤형 이미지 검색·관리 시스템을 구축해 대량의 이미지를 관리해야 하는 기업들의 업무 효율성과 생산성을 높일 수 있는 것으로 기대되는 대목이다. LG AI연구원과 데이터 학습과 서비스 개발까지 함께 한 세잘 아민 셔터스톡 최고기술책임자(CTO)는 "지난달 상용화 서비스를 시작해 글로벌 고객사 10곳을 대상으로 '얼리 액세스(앞서 해보기)'를 진행하며 기술을 발전시켜 나가고 있다"며 "캡셔닝 AI는 고객들이 반복적인 작업보다 좀 더 본질적이고 창의적인 일에 집중할 수 있도록 돕는 AI가 될 것"이라고 밝혔다. 특히, LG AI연구원과 셔터스톡은 실용적이면서도 신뢰할 수 있는 AI 모델 개발을 위해 학습 데이터의 편향성·선정성 등 윤리 검증을 진행해 저작권 투명성도 확보했다. 한편, LG AI연구원은 이번 공개와 맞물려 22일까지 진행되는 학회 기간에 LG전자, LG이노텍, LG에너지솔루션, LG유플러스 등 주요 계열사와 함께 글로벌 AI 우수 인재 확보에도 나선다. 이를 위해 19일 학회에 참가한 석·박사 학생들을 대상으로 네트워킹 행사인 'LG AI DAY'를 진행한다. hoya0222@fnnews.com 김동호 최종근 기자
2023-06-19 15:00:22【서울·밴쿠버(캐나다)=김만기 기자·한국과학기자협회 공동취재단】 한국과학기술원(KAIST) 연구팀이 사람처럼 학습한 적 없는 이미지나 영상을 읽어내는 생성형 인공지능(AI) 모델을 개발해 전세계 142개 팀과 겨뤄 2위를 차지했다. LG AI연구원이 세계 최대 컴퓨터 비전 학회 'CVPR'을 앞두고 18일(현지시간) 캐나다 밴쿠버 컨벤션 센터에서 '제로샷 이미지 캡셔닝'을 주제로 워크숍을 개최했다. 이날 워크숍에서는 올 2~4월 진행된 'LG 글로벌 AI 챌린지'에서 2위를 차지한 KAIST 연구팀의 오영택 전기및전자공학부 박사과정생의 수상자 발표가 진행됐다. 올해 처음 개최한 이번 챌린지에 전세계 총 142개 연구팀이 참여한 가운데 중국 난징과기대 연구팀과 한국 KAIST 연구팀이 각각 1·2위를 차지했다. 또 카카오브레인과 우리은행 연구팀이 3·4위를 각각 차지했다. LG AI연구원은 국제전기전자공학회(IEEE)가 개최하는 'CVPR'에서 연구 분야 성숙도가 일정수준 이상 될 때까지 수년간 이어가는 경우가 많은 만큼 이번 워크숍을 시작으로 이미지 캡셔닝 분야 연구를 주도해 나간다는 방침이다. 이날 워크숍에서는 'LG 글로벌 AI 챌린지'에서 2위를 차지한 KAIST 연구팀의 오영택 전기및전자공학부 박사과정생의 수상자 발표가 진행됐다. 오 연구원은 "LG AI연구원이 첫 진행한 'LG 글로벌 AI 챌린지'에서 AI가 기존 이미지 데이터를 참조할 때 부하가 걸리지 않도록 최적화하는 데 초점을 맞춰 좋은 결과를 낼 수 있었다"며 "최근 이미지를 보고 이를 글로 묘사하는 '비전 인식' 분야에 관심이 집중되고 있다"고 강조했다. 난징과기대 연구진은 이미지 캡셔닝 AI모델의 이미지 이해력을 높이기 위해 유사한 내용을 담고 있는 참조 데이터를 대규모 학습시켜 AI 모델의 정확도에서 가장 높은 점수를 얻어 우승을 차지했다. 워크숍에서 챌린지 주관사로 발표에 나선 알레산드라 살라 셔터스톡 AI·데이터사이언스 총괄책임자는 "AI모델을 만들 때 가장 중요한 것은 데이터를 수집하고 고품질화하는 작업"이라며 "이미지 캡셔닝 AI모델에는 편견과 고정관념을 배제하고 다양성·형평성·포용성을 가지도록 해야 한다"고 설명했다. 김승환 LG AI연구원 비전랩장은 내년 CVPR에서도 챌린지와 워크숍을 이어갈 계획이라고 밝혔다. 김 비젼랩장은 "올해는 일반 이미지를 주로 썼다면 내년엔 다양한 분야에 활용되는 이미지 등 실제로 활용할 수 있는 형태까지 확장하겠다"며 "이미지 이해 연구에서 연구원의 리더십을 확장해 나갈 것"이라고 말했다. monarch@fnnews.com 김만기 기자
2023-06-19 14:04:54【라스베이거스(미국)·서울=임수빈 김미희 기자】 LG그룹 인공지능(AI) 연구허브인 LG AI연구원이 아마존웹서비스(AWS) 클라우드컴퓨팅(클라우드)을 통해 AI 기반 ‘이미지-투-텍스트 캡셔닝 솔루션’을 선보인다. 이 솔루션은 3000억개 파라미터를 보유한 LG AI연구원의 멀티모달 파운데이션 모델(FM)인 ‘엑사원(EXAONE)’을 활용한다. 엑사원은 광고, 패션, 리테일 등 업종별 기업 대상으로 보다 정확한 캡셔닝 솔루션을 제공한다는 목표다. 각 기업이 이미지 검색 등 반복적인 업무 대신 기획 및 창작에 집중할 수 있도록 지원하는 게 핵심이다. AWS는 29일(현지시간) 미국 라스베이거스 베네시안호텔에서 열린 ‘리인벤트(re:Invent) 2023’를 통해 이같이 밝혔다. LG AI연구원은 엑사원의 학습 중 파라미터 수가 늘어나는 등 필요에 따라 비용 효율적으로 IT 리소스를 확장할 수 있도록 AWS ‘아마존 엘라스틱 컴퓨트 클라우드(Amazon EC2)’를 사용한다. 엑사원의 새로운 제로샷 이미지 캡션 솔루션은 생성형 AI를 사용해 △인간 인지 능력과 유사하게 △이전 경험과 지식 및 훈련을 바탕으로 △본적 없는 객체나 장면을 자동으로 이해하고 설명한다. 이는 엑사원이 한국어와 영어로 된 이미지와 텍스트를 이해하고 인간에 가까운 추론 능력을 활용해 정확하고 상세한 이미지 캡션과 키워드를 작성할 수 있게 한다. 즉 광고 같은 산업군에서는 LG AI연구원의 기술을 활용해 제품 설명을 자동화하거나 광고·마케팅 캠페인을 위한 새로운 콘텐츠를 만들 수 있다. 특히 소비재 기업과 마케팅 에이전시 등 LG AI연구원의 고객들은 AWS의 확장성을 활용해 시간당 2000개 이상의 이미지 캡션을 생성할 수 있다. LG AI연구원은 엑사원을 통해 다양한 크리에이티브 산업 분야에서의 생성형 AI 도입을 가속화하기 위해 전 세계 여러 기관과 협력하고 있다. 일례로 미국 파슨스디자인스쿨과 협업하여 패션, 디자인, 미디어 분야 전문가들과 함께 생성형 AI 관련 기술과 서비스를 개발하고 있다. LG AI연구원은 머신러닝(기계학습) 모델을 구축·훈련·배포하는 완전 관리형 서비스인 ‘아마존 세이지메이커’를 사용해 3억 5000만개의 고해상도 이미지와 텍스트 세트를 엑사원에게 학습시켰다. 이화영 LG AI연구원 상무는 “AI는 많은 산업에 혁신을 일으키고 있다. 우리는 사람들이 보다 창의적으로 일할 수 있도록 비용 효율적인 방식으로 지원할 수 있는 이 기술의 잠재력에 대해 갖는 기대가 크다”며 “엑사원은 크리에이티브 분야에서 생성형 AI를 더 쉽게 활용할 수 있게 해주는 강력한 도구이며 AWS의 머신러닝 역량은 우리가 혁신적인 솔루션을 빠르게 개발하고 배포하는 데 큰 도움이 되었다”고 전했다. 바시 필로민 AWS 생성형 AI 부문 부사장은 “콘텐츠 생성 산업이 급성장하는 가운데 LG AI연구원은 엑사원 플랫폼 같은 기술이 AWS에 구축된 신속한 이미지-투-텍스트 캡션 솔루션을 활용해 어떻게 AI, 디자이너, 아티스트 간의 협업을 촉진할 수 있는지 보여주고 있다”며 “전 세계에 새로운 차원의 창의성이 발휘될 수 있도록 LG AI연구원의 생성형 AI 혁신과 확장을 지원할 수 있기를 기대한다”고 말했다. elikim@fnnews.com 김미희 임수빈 기자
2023-11-29 17:35:41[파이낸셜뉴스] 카카오의 인공지능(AI) 개발 자회사 카카오브레인이 AI 헬스케어 부문에서 유의미한 연구 성과를 잇따라 거두었다. 19일 업계에 따르면 카카오브레인의 AI신약연구팀은 지난 11일 단백질 구조 예측 프레임워크 '솔벤트(Solvent)'를 공개했다. 솔벤트는 단일서열 기반의 단백질폴딩(단백질의 아미노산 서열이 3차원 구조로 접히는 과정) 모델을 지원해 글로벌 기업의 단백질 구조 예측 AI보다 최소 3배 이상 빠른 속도로 단백질 구조를 예측할 수 있다. 또 단백질 구조 예측 모델에 대한 연구 진입 장벽을 낮추기 위해 '솔벤트'의 학습 코드도 깃허브에 추가 공개했다. 모델 공개 자체로는 개별 연구자의 연구 접근성이 떨어진다는 점에서 AI 신약 개발 연구자들이 쉽고 빠르게 연구 태스크를 진행할 수 있도록 돕고, AI 신약 개발 생태계 발전에 기여하고자 학습 코드 공개를 결정했다. '솔벤트'는 다중서열정렬에 의존하는 기존 모델과 달리 단일 서열 기반 구조 예측을 수행한다. 이에 드 노보(de novo) 단백질, 오르판(orphan) 단백질 등 난해한 단백질 구조 예측에 특화돼 있다. 또 현존하는 최신 모듈을 사용자 친화적으로 탑재해, 새로운 모델을 쉽게 설계할 수 있게 했다. 사용자는 이를 활용해 개발한 커스텀 모델을 손쉽게 추가해 일반화하고, 간단한 코드로 균일한 모델 평가를 실행할 수 있다. 여기에 카카오브레인은 초거대 AI 기술까지 적용해 속도와 메모리 효율을 기존 학습 코드 대비 약 30% 향상시켰다. 카카오브레인 측은 '솔벤트' 공개로 연구 비용 절감과 더 나아가 신약 설계 단계 및 소요 시간 단축 효과도 기대하고 있다. 아울러 AI 캐드(CAD) 연구 분야에서도 해외 학계로부터 인정을 받고 있다. 초거대 AI를 활용한 흉부 엑스레이 언어-이미지 사전 훈련 관련 논문은 의료 영상처리 분야의 최고 국제 컨퍼런스인 'MICCAI2023'의 포스터에 등재됐다. 카카오브레인은 기존 방법보다 질병 검출률을 효율적으로 증가시키는 결과를 도출해 AI 기술이 엑스레이 판독 분야에서 유용하게 활용될 수 있다는 사실을 입증했다. 아울러 세계 최대 컴퓨터 비전 학회 '국제컴퓨터비전·패턴인식 학술대회(CVPR) 2023'에서 셔터스톡, LG AI 연구원, 서울대 AI대학원 주관으로 열린 이미지 캡셔닝 챌린지 'NICE'에서도 3위를 차지했다. 이 같은 성과를 바탕으로 흉부 엑스레이 초안 판독문 작성 모델의 성능을 고도화할 계획이다. soup@fnnews.com 임수빈 기자
2023-07-19 09:13:02【파이낸셜뉴스 서울·밴쿠버(캐나다)=김준석 기자·한국과학기자협회 공동취재단】 인공지능(AI)·바이오(Bio)·클린테크(Clean Tech) 등 이른바 'ABC 사업'을 중심으로 미래 기반 구축을 선언한 LG그룹이 국내외 AI 인재 확보에 박차를 가하고 있다. 세계 최대 컴퓨터비전학회에 참가한 LG그룹은 이미지 검색 분야 생성형 AI 상용화 서비스인 '캡셔닝 AI' 공개에 이어 국내외 신진 AI 연구자들의 네트워크장을 마련하며 적극적인 인재확보에 나섰다. ■하고 싶은 연구 지원해주는 LG 21일 관련 업계에 따르면 20일(현지시간) 캐나다 밴쿠버에서 개막한 세계 최대 컴퓨터비전학회인 'CVPR 2023'을 하루 앞두고 LG가 'LG AI데이' 행사를 개최했다. LG AI데이는 AI 연구자와 LG그룹의 AI 관련 비전을 공유하고 네트워킹을 넘어 인재 채용까지 염두에 둔 행사다. LG그룹은 지난해 CVPR에서 처음 AI데이를 개최한 이후 △인터스피치 △뉴립스 등 주요 AI 학회에서 네트워킹 행사를 꾸준히 진행했다. 이날 행사에는 AI 관련 연구자 100여명이 모이는 등 현장은 뜨거운 열기로 가득했다. 주최 측인 LG는 행사를 1부와 2부로 나눠 1부에는 관심 기업, 2부는 관심 연구에 따라 테이블을 섞는 등 다양한 인재 네트워크 구축에 나섰다. 연구자들의 대화 화두는 단연 구글 등 글로벌 빅테크 입사 제의를 뿌리치고 지난해 3월 설립된 LG AI연구원 미시건 리서치센터에 직행한 미국 매사추세츠공과대(MIT) 졸업생이었다. 김광현 서울대 전기·정보공학부 박사과정생은 "MIT 졸업생이 LG에 입사하기로 한 이유로 본인이 하고 싶은 연구를 적극 지원해 준 점을 꼽았다고 들었다"며 "기업이 원하는 연구와 연구자 본인이 하고 싶은 연구를 함께 지원한다는 점에서 LG에 매력을 느꼈다"고 말했다. ■"3년간 2000억원"…2년새 몸집 3배 커진 AI연구원 일부 연구자는 기업간거래(B2B)와 기업개인간거래(B2C)를 넘나드는 다양한 사업영역에 매력을 느꼈다. 김성연 포스텍 컴퓨터공학과 박사과정생은 "LG는 B2C에 대한 AI의 비전을 소개하는 데도 주력한다"며 "연구가 어떻게 사회에 영향력을 미치는지 생각하고 깨닫게 된다"고 했다. LG 관계자는 "네트워킹 행사 개최 등 인재확보를 위한 노력의 결과로 올해만 박사급 연구원 10명이 LG AI연구원에 합류하는 등 성과를 거뒀다"고 전했다. 올해는 LG AI연구원을 비롯해 △LG전자 △LG이노텍 △LG에너지솔루션 △LG유플러스 등 계열사들도 CVPR 행사에 부스를 꾸리고 인재 확보에 나섰다. 앞서 LG는 2020년 말 LG AI연구원을 설립했다. LG전자, LG디스플레이, LG화학, LG유플러스, LG CNS 등 16개 계열사가 참여한 AI연구원은 출범 당시 '3년간 글로벌 인재 확보, AI 연구개발 등에 2000여억원 투자'를 목표로 삼았다. 초창기 70명 안팎이었던 조직 규모는 출범 2년 만에 200명을 웃돌 정도로 몸집이 커졌다. 또 LG는 기업형 벤처캐피털(CVC)인 LG테크놀로지벤처스를 통해 올해만 AI 기술을 지닌 스타트업 4곳에 투자하며 혁신 기술을 보유한 기업들과의 시너지를 모색했다. 또 AI연구원 설립 1년 만에 초거대 AI인 엑사원을 개발했다. '인간을 위한 전문가 AI'를 표방한 엑사원은 금융, 제조, 의료, 디자인, 교육, 서비스 등 사실상 전 영역에서 인간 전문가와의 협업 가능성을 높여가고 있다. rejune1112@fnnews.com 김준석 기자
2023-06-21 18:21:56【 서울·밴쿠버(캐나다)=김만기 기자 한국과학기자협회 공동취재단】 유네스코 여성AI윤리플랫폼 공동의장인 알레산드라 살라 셔터스톡 AI·데이터사이언스 총괄책임자(사진)는 18일(현지시간) 인공지능(AI) 윤리 문제와 관련, "AI 모델이 지향해야 하는 방향은 완벽이 아니라 유용성"이라고 말했다. 사람이 완벽하지 않아 실수하는 것처럼 AI 모델도 완벽하지 않다는 것이다. 살라 총괄책임자는 "AI가 편향된 데이터를 학습해 윤리 문제를 초래한다면, AI 모델을 조정하고 재학습시켜 기술의 혜택을 누릴 수 있다"고 덧붙였다. 그는 국제사회에서 AI 윤리 제정에 기여해 온 전문가다. 현재 유네스코와 국제비영리기구 '위민 인 AI'에서 각각 공동의장과 회장을 맡고 있으며, AI 분야 여성 권익신장 활동에 나서고 있다. 노키아 벨연구소 AI윤리자문위원을 지냈고, 현재 글로벌 기업 셔터스톡 AI·데이터사이언스 총괄을 맡고 있다. 그는 "AI 모델이 편견에 치우치지 않도록 다양성과 글로벌 대표성을 가진 데이터를 학습시켜야 한다"고 강조했다. 살라 총괄은 "AI를 활용한 제품 개발주기가 5~10년이었다면 이젠 그 기간이 적게는 6개월로 줄었다"면서 "특히 '이미지 캡셔닝 AI'는 산업계 활용을 위해 매우 중요한 기술"이라고 말했다. 그는 현재 소속된 셔터스톡에서 LG AI연구원과 '캡셔닝 AI' 분야 협력을 주도하고 있다. 캡셔닝 AI는 처음 보는 사진·영상을 자연어로 처리하는 기술이다. AI에 사람처럼 '눈'을 달아준다고 비유할 수 있다. 캡셔닝 AI 활용 분야는 무궁무진하다. 예를 들어 AI가 독거노인을 관찰하는 영상을 보고 인간에게 건강상태를 보고하는 일이 가능해진다. 또 교육 분야에서 다양한 영상학습을 요약하거나 중요한 부분을 강조하는 작업을 할 수 있으며 시각장애인에게는 이미지 캡셔닝과 음성을 결합해 '길안내 비서'가 될 수도 있다. 살라 총괄은 LG그룹과 셔터스톡의 협업 경쟁력에 대해 "LG는 AI에 활용할 고품질 데이터셋을 보유한 것"이라며, "LG는 AI 기반 혁신제품을 시장에 출시하기 위해 진지한 투자를 진행 중이며 셔터스톡과 협업해 고품질 데이터를 확보해 경쟁력이 있다"고 설명했다. 그녀는 "유네스코에서 AI 윤리에 관한 권고를 마련하고 각국 정부와 대화를 나누고 있다"며 "한국이 내부적으로 마련한 AI 개발 윤리지침은 한계가 있는 만큼 국제사회와 협력이 필요하다"고 조언했다.
2023-06-19 19:25:47