[파이낸셜뉴스] 네이버의 대화형 인공지능(AI) 에이전트 클로바X가 오는 27일 서비스 업데이트를 통해 시각 정보 처리 능력을 새롭게 추가한다. 또 네이버는 지난 20일 ‘클로바’ 공식 사이트의 기술 블로그를 통해 생성형 AI 기반의 음성 합성 기술도 공개하며, 기반 모델인 하이퍼클로바X를 텍스트 뿐 아니라 이미지, 음성도 동시에 처리할 수 있는 ‘멀티모달’ AI로 고도화하며 생성형 AI 기술 경쟁력을 갖추겠다는 목표다. 22일 네이버에 따르면 오는 27일 클로바X의 이미지 이해 기능 업데이트로, 이용자들은 클로바X 대화창에 업로드한 이미지에서 추출된 정보와 입력한 질의를 바탕으로 AI와 대화할 수 있다. 클로바X는 사진 속 현상을 묘사하거나 상황을 추론하는 등 다양한 지시를 수행할 수 있다. 예를 들어 이미지나 그림 형식으로 되어 있는 표, 그래프를 클로바X가 이해하고 분석하는 것이 가능하다. 기존의 클로바X가 논리적 글쓰기, 코드 작성, 번역 등의 작업에 활발히 사용된 것에서 더 나아가 이미지 이해 능력을 기반으로 개인의 생산성 향상 도구로서 활용 범위가 더 넓어질 전망이다. 특히 네이버의 자체 거대언어모델(LLM) 하이퍼클로바X가 결합해 더 정확하고 신뢰성 있는 서비스를 제공한다. 네이버에 따르면, 실제 대한민국 초·중·고등학교 검정고시 총 1480개 문항을 AI 모델에 이미지 형태로 입력하고 문제를 풀게 한 결과 클로바X는 약 84%의 정답률을 기록하며 오픈AI의 GPT-4o(78%)보다 높은 정답률을 보였다. 네이버는 기술 블로그를 통해 하이퍼클로바X 기반 음성 AI 기술도 공개했다. 기존의 음성 인식, 음성 합성 기술보다 한층 발전한 모델로 LLM의 특징인 뛰어난 문맥 이해 및 지시문 해석 능력을 활용해 언어 구조 및 발음 정확도 개선은 물론 감정 표현까지 더한 자연스러운 대화가 가능하다. AI 음성 기록 ‘클로바노트’, AI 안부전화 ‘클로바 케어콜’, AI 음성 합성 ‘클로바더빙’ 등 다양한 음성 AI 서비스를 운영해온 네이버는 음성 멀티모달 LLM 기술로 더 편리한 서비스를 제공한다는 계획이다. 성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 “거대 언어 모델로 출발한 하이퍼클로바X는 이미지 이해 능력을 더한 거대 시각 언어 모델(Large Vision Language Model), 나아가 음성 멀티모달 언어 모델로 발전하고 있다”며 “하이퍼클로바X의 발전된 능력은 대화형 AI 에이전트 클로바X를 비롯한 여러 네이버 서비스에 도입해 새로운 사용자 가치를 창출하고, 기업용 AI 솔루션으로도 제공하며 하이퍼클로바X 생태계를 더욱 확장해나갈 것”이라고 말했다. 아울러 네이버는 하이퍼클로바X를 멀티모달 LLM으로 고도화하고 서비스에 적용하는 과정에서도 ‘AI 안전성’을 적극적으로 실천할 예정이다. 지난 6월 공개한 네이버의 AI 안전성 실천 체계 ‘네이버 ASF’로 AI 시스템의 잠재적 위험을 평가하고, 특히 음성 AI 기술은 보다 안전한 서비스 제공을 위해 다각도로 검토를 이어갈 방침이다. soup@fnnews.com 임수빈 기자
2024-08-22 08:24:44[파이낸셜뉴스] 인공지능(AI) 전문기업 와이즈넛은 지난달 29일 '2024 산업지능화컨퍼런스에 참여해 제조업에 적용될 수 있는 생성형AI 기술을 제안했다고 3일 밝혔다. 김정민 와이즈넛 글로벌전략사업본부장(이사)은 '제조업의 생성형AI 적용 방안'을 주제로 발표를 진행했다. 김 이사는 현재 제조업 현장 내 AI 도입을 위해 필요한 구조화된 양질의 데이터가 부족하고, 전체 데이터의 90%가 다크데이터로써 활용되지 않고 버려지는 시장 현황을 짚었다. 그러면서 와이즈넛은 경쟁력의 핵심이 될 것으로 예상되는 다크데이터를 활용하는 기술을 지속적으로 연구해 오고 있다고 설명했다. 생성형AI 모델에 멀티모달 검색증강생성(RAG) 기술을 접목하는 등 기술 연구에 박차를 가하고 있다는 설명이다. 이를 통해 공급망 관리, 제조, 고객서비스 등 전체 제조 분야의 가치사슬에서 해당 기술이 활용될 수 있다고 김 이사는 강조했다. 멀티모달 RAG는 텍스트, 이미지, 영상, 음성 등 이종 데이터 간 관계성을 추론해 텍스트 등 다양한 포맷으로 생성을 지원할 수 있는 기술을 가리킨다. 이외에도 김 본부장은 제조 현장의 AX(인공지능 전환) 사례도 소개했다. 김 이사는 "앞으로도 와이즈넛은 지난 24년 간 쌓아 온 AI 기술력과 자체 RAG 기술을 기반으로 제조 분야의 전 과정에 요구되는 휴먼노하우를 디지털화하고, 이를 생성형AI에 적용해 제조현장의 생산성 극대화를 도모할 수 있도록 적극 노력해 나갈 것"이라고 밝혔다. jhyuk@fnnews.com 김준혁 기자
2024-04-03 14:17:06[파이낸셜뉴스] 하나증권은 19일 크라우드웍스에 대해 멀티모달 AI시대에 LLM(거대언어모델)개발 수주 증가에 따른 AI데이터 수요 증대 등으로 올해 외형 성장이 기대된다고 진단했다. 다만 투자의견과 목표주가는 제시하지 않았다. 조정현 연구원은 "크라우드웍스의 4분기 실적은 매출액 61억원, 영업적자 1.4억원을 기록했는데, 2023년 연간 실적은 매출액 239억원(+101.6%, YoY), 영업적자 15억원(적지, YoY)으로 전년 대비 적자폭이 대폭 축소됐다“라며 ”외형 성장의 주요 요인은 LLM 모델 개발 수주 증가에 따른 AI 데이터 수요 증대 및 AI 교육 플랫폼 성장에 기인한다“라고 밝혔다. 그러면서 2024년에도 데이터 부문과 맞춤형 LLM 사업의 동반 성장이 예상된다“라며 ”오픈AI가 보여준 ‘달리-3’(text-to-image) 및 ‘소라’(text-to-video)와 같은 멀티모달 AI의 등장으로 파운데이션 모델 학습에 필요한 데이터 수요는 급증할 것으로 판단되며, 고품질 텍스트 데이터는 물론 이미지·음성·비디오 데이터에서도 수요가 본격화될 것으로 예상된다“라고 부연했다. 하나증권은 올해 동사와 같은 생성형 AI 학습에 필수적인 데이터 가공 플랫폼과 기술력을 갖춘 업체들의 구조적 성장이 기대된다고 분석했다. 이에 데이터 부문 매출은 22년 58억원23년 132억원24년F 261억원으로 고성장이 지속될 전망이라고 봤다. 동 사의 경우 올해 기업들의 생성형 AI 도입이 본격화되는 시점으로, 신규 사업인 맞춤형 LLM서비스 또한 순항 중에 있다는 설명이다. 조 연구원은 “현재 금융권 고객사를 중심으로 약 60건의 생성형 AI 도입 PoC 및 프로젝트를 진행 중인 가운데, LLM 데이터셋 구축과 동시에 거대언어모델 개발 프로젝트 레퍼런스를 보유한 동사의 선점 효과가 기대된다”라고 언급했다. 여기에 크라우드웍스의 자회사인 닥터웍스가 의료전문 LLM 솔루션 글로벌 출시를 앞 둬 호재가 기대된다고 예상했다. 실제 크라우드웍스의 자회사인 닥터웍스는 국내 유일 의료 전문 LLM 솔루션 업체다. 2020년 11월 국내 최초 의료 크라우드소싱 플랫폼을 출시하며, 약 1200명의 전문의가 26개 분과의 고품질 의료 데이터를 직접 수집 및 가공하고 있다. 닥터웍스는 텍스트·이미지·생체신호·음성 등 전 의료 데이터 부문을 아우르는 멀티모달 데이터를 확보했으며, 현재 약 260만건의 의료 데이터 가공 레퍼런스를 보유하고 있다. 조 연구원은 “이를 통해 동사는 LLM 기반 의료 AI 솔루션 ‘닥터웹’을 개발 완료, 올해 국내 제품 출시 및 북미 시장 진출을 본격화할 전망”이라며 “최근 구글, 오픈AI 등 글로벌 업체들의 멀티모달 AI가 의료 산업에 적용되고 있는 만큼, 자회사 닥터웍스의 행보에도 주목이 필요하다”라고 전했다. 한편 하나증권은 크라우드웍스의 2024년 실적과 관련, 매출액 367억원(+53.0%, YoY), 영업이익 73억원(흑전, YoY)으로 실적 턴어라운드를 전망했다. 조 연구원은 “올해 실적 성장은 텍스트·이미지·영상·음성 등 멀티모달 AI 데이터 수요증대 및 신규 사업인 맞춤형 LLM 서비스 매출 가시화에 기인한다”라며 “또한 동사는 네이버 클라우드와 마이크로소프트 Azure 클라우드 파트너사(MSP)로 2025년부터는 클라우드 서비스 진출을 통해 외형 성장세는 더욱 가파라질 것으로 예상한다”라고 덧붙였다. kakim@fnnews.com 김경아 기자
2024-02-19 09:02:56[파이낸셜뉴스] 카카오가 대규모 언어모델(MLLM)인 '허니비'를 공개하면서 네이버와 멀티모달 인공지능(AI) 경쟁이 본격화되는 모습이다. 카카오는 상대적으로 AI 기술전에서 뒤처졌다는 분위기를 반전시키기 위해 이미지를 인식해 답하는 멀티모달 '허니비'를 앞세워 교육, 쇼핑 등으로 AI 서비스를 확장할 계획이다. 이보다 앞서 지난해 자체 AI 모델인 ‘하이퍼클로바X’를 발표한 네이버도 지난해 12월 멀티모달 기능인 '이미지 편집'을 일부 추가하면서 향후 다양한 영역에서 경쟁을 예고하고 있다. 21일 카카오브레인에 따르면 깃허브를 통해 공개된 카카오의 '허니비'는 이미지를 인식해 텍스트로 답하는 MLLM 오픈소스다. 카카오가 개발 중인 ‘코(Ko)GPT2.0’에 적용되면 이미지로 묻는 질문에도 답을 얻을 수 있다. 카카오는 '허니비'의 활용 영역으로 우선 교육 분야를 지목했다. 이미지를 통해 사용자와의 상호작용이 가능해 향후 효과적인 교육 및 학습 보조 도구로 사용될 것이라는 전망이다. 멀티모달 기반 AI는 의료, AI챗봇에서 진화한 AI 가상비서, 자율주행 차량, 유통, 쇼핑 등 실생활과 밀접한 영역부터 산업 전반까지 전방위로 활용 가능하다. 음식 사진을 올리며 레시피를 묻는 질문에 사진과 영상으로 답을 하거나, 자신의 사진을 올리고 어울리는 헤어 스타일이나 패션 정보를 얻을 수도 있다. 카카오가 '허니비' 오픈소스를 외부 공개하는 방식을 채택한 점도 눈여겨볼 점이다. 공개된 연구 모델 수가 적고 학습 방법도 자세히 공개되지 않아 개발이 어려운 멀티모달 언어모델인 '허니비'의 오픈 소스를 풀어 각 업체에서 다양한 서비스를 출시할 수 있도록 했다. 네이버도 ‘하이퍼클로바X’를 기반으로 만든 대화형 AI '클로바X'에 지난해 12월 멀티모달 기능인 '이미지 편집'을 일부 추가했다. '이미지 편집'에서 이미지 중에서 어떤 영역을 삭제하거나 변경할 수 있다. 예를 들어 강아지가 잔디밭에서 놀고 있는 사진에서 배경은 그대로 두고 강아지를 토끼로, 고양이로 바꾸거나 삭제할 수 있다. 여러 사람이 찍힌 사진에서 특정한 사람만 삭제하는 것도 가능하다. 향후 기능 고도화를 통해 이 기능을 전체 공개하고, 음성 등 다른 멀티모달 능력 추가도 검토 중이다. 최근 구글, 오픈AI, 메타 등 빅테크들의 개발 경쟁도 뜨겁다. 구글의 '제미나이', 오픈AI의 'GPT-4'가 MLLM의 대표주자다. 메타의 멀티모달 이미지 생성AI 카멜레온은 텍스트를 이미지로 구현하고, 이미지를 텍스트로 설명하는 기능을 동시에 지원한다. 실제로 구글은 엑스레이, CT촬영, 의료 차트 등을 결합해 의료 관련 질문에 답변하는 'Med-PaLM' 시리즈를 개발 중이다. 또 자동차 자율주행 기술에 음성, 생체 신호, 몸짓 등의 데이터가 추가되면 자율주행 정확도도 높일 수 있다. 텍스트로 올린 물류 현황을 그래프나 도표로 전환하는 것도 가능하다. yjjoe@fnnews.com 조윤주 기자
2024-01-21 10:40:40지난해가 생성형 인공지능(AI), 초거대 AI 등에 대한 개념이 널리 퍼진 'AI 원년'이라면 올해는 AI가 생성 관련 애플리케이션(앱)뿐만 아니라 통화 발·수신, 통역 등 일상 속에서 AI를 더 친근하게 접할 수 있는 해로 자리잡을 전망이다. 특히 글, 그림 등에 대한 맥락 이해 및 분석을 넘어 인간의 언어, 복잡한 영상 등의 맥락을 듣고 보고 이해할 수 있는 '멀티모달 AI'에 대한 기대감도 높다. AI 관련 기업들은 올해 AI 적용 관련 비용절감 외 다양한 과제를 눈앞에 두고 있다. 글로벌 진출과 보안 등이다. 글로벌 거대기술기업(빅테크)이 AI가 익숙하지 않은 국가들에 대한 영향력도 점차 확장하는 등 글로벌 AI 주도권 경쟁이 이미 시작된 만큼 올해는 국내 AI 모델에 대한 차별화를 보다 명확하게 꾀해야 한다는 지적이 나온다. 아울러 멀티모달 AI 쓰임새가 늘어나면서 AI가 일상 속으로 더 깊이 들어오는 만큼 개인정보 보호 등 보안체계 강화를 통해 신뢰성·지속가능성을 확보하는 것도 관건이다. ■멀티모달 AI 고도화 기대감3일 업계에 따르면 올해를 시작으로 본격적으로 스마트폰을 중심으로 온디바이스AI 개념이 도입될 것으로 예상된다. 온디바이스AI는 디바이스 내에 내장된 AI칩 등을 기반으로 기계가 자체적으로 AI 관련 성능을 구현할 수 있는 기기를 의미한다. 지금까지 디바이스 운영체제 안에서 제3자 소프트웨어 또는 앱을 기반으로 AI 기능을 지원하는 것과는 차원이 다른 개념이다. 온디바이스AI를 중심으로 기업·개인간거래(B2C) 분야에선 AI가 자연스럽게 대중에게 더 친근하게 사용될 것으로 예상된다. 대표적 기능이 통·번역 기능이다. 이미 국내에선 SK텔레콤이 AI 개인비서 앱인 '에이닷(A.)'을 통해 해당 기능을 선보인 바 있다. 삼성전자는 이달 공개 예정인 갤럭시S24 시리즈에 이 같은 기능을 탑재한다. 모바일 업계에선 삼성전자를 시작으로 애플 등 경쟁사들도 올해 신제품에 온디바이스AI 기능을 탑재하는 데 역량을 기울일 것으로 예상된다. 스마트폰 외 확장현실(XR) 기기, 노트북 등 온디바이스AI 분야를 넓혀 나갈 것이란 전망도 지배적이다. AI가 통화번역 등 분야에도 진출하면서 '멀티모달 AI' 성능 고도화도 자연스럽게 따라올 것이란 게 업계 관측이다. 멀티모달AI는 문자, 그림, 영상, 음성 등을 동시에 받아들이는 등 여러 채널과 맥락을 종합적으로 학습하고 사고할 수 있는 AI다. 지난해 세계 최대 이동통신 전시회인 모바일월드콩그레스(MWC 2023)에서 몇몇 통신사는 디바이스가 촉감을 전달하는 기술을 선보이기도 했다. AI 기술을 개발하는 업계도 올해는 멀티모달 AI가 한층 발전하는 한 해가 될 것으로 예상했다. 업계 관계자는 "전 세계적으로 AI 제품의 성능을 높이는 데 힘을 쓰고 있다"며 "언어모델만으로 충족할 수 없는 멀티모달 시장에 대한 경쟁도 본격적으로 시작될 것으로 예상한다"고 내다봤다. ■"보안 더 중요… 규제도 대비해야"AI가 일상 속으로 더 깊게 들어오면서 개인정보 보호 등 보안의 중요성이 쟁점으로 떠오를 전망이다. 서구권에서도 AI규제 도입을 서두르고 있는 만큼 기업 입장에선 규제 대비도 중요해질 것이란 관측이다. 토종 AI 상품 글로벌화는 내년에도 우리 기업에 여전한 과제다. 우선 보안 등에 대한 책임 소재가 기업에 더 분명해질 것으로 예상된다. AI가 단순업무 작업에 적용되는 것을 넘어 전화 등 프라이버시 영역으로 들어오면서 보안·개인정보 문제가 더 민감해질 가능성이 높다. 김명주 서울여대 정보보호학과 교수는 "프라이버시 정보가 어딘가에 기록된다는 것 자체가 부담스러운 것"이라며 "AI 일상화 시대에선 클라우드가 보안이 뚫리거나 고장나면 기업 입장에선 이전보다 더 큰 리스크, 역풍을 맞을 수 있다"고 설명했다. 이어 "글로벌 스탠더드 입장에선 규제 논의가 본격화될 것"이라며 "유럽연합(EU)의 AI 관련법 합의, 미국 행정부의 AI 행정명령 등을 우리 입장에서도 무시하기 힘들 것"이라고 덧붙였다. EU, 미국에서 진행되고 있는 관련 논의는 자국 내 정보보호 등에 대한 기준이 담겨 있는 만큼 글로벌 시장에 진출하려는 국내 기업 입장에서도 반드시 참고해야 할 기준이 될 것으로 보인다. 국내에서도 AI산업 육성 및 신뢰 기반 조성에 관한 법률 등 AI 관련법이 국회에 발의돼 있지만, 아직 국회 문턱을 넘지 못했다. 올해 총선 이후 통과될 가능성이 높다. jhyuk@fnnews.com 김준혁 기자
2024-01-03 18:18:27[파이낸셜뉴스] #.직장인 A씨는 출근길에 ‘챗GPT’와 늘 대화를 나눈다. 스마트폰 애플리케이션(앱) ‘챗GPT’를 통해 여행사진으로 대화를 시작하거나 음성명령으로 독감증상에 대한 질의응답도 한다. 이때 영어는 한국어로 번역해주고, 한국인 발음도 명확하게 인식하기 때문에 ‘언어장벽’은 없다. 오픈AI가 지난해 11월 전 세계에 선보인 ‘챗GPT’가 1년 동안 빠르게 진화하며 생성형 인공지능(AI) 대중화를 앞당기고 있다. 텍스트 생성을 넘어 이제는 ‘보고, 듣고, 말할 수 있는’ 챗봇 역할을 톡톡히 하고있다. 특히 내년부터는 멀티모달 기반의 생성형 AI 경쟁이 더욱 뜨거워질 전망이다. 멀티모달은 인간과 텍스트, 이미지, 음성, 영상 등 다양한 형태로 AI 서비스를 주고 받을수 있는 기술이다. ▶관련기사 2면 1일 글로벌 시장조사기관 그랜드뷰리서치에 따르면 전 세계 생성형 AI 시장 규모는 2022년 101억4000만 달러(약 13조7711억원)에서 오는 2030년에는 1093억7000만 달러(약 148조 5353억원)에 이를 것으로 전망된다. 즉 향후 멀티모달 AI가 다양한 산업과 융합하면서 연평균 35.6% 급성장할 것이란 게 그랜드뷰리서치의 분석이다. 오픈AI도 6일 미국에서 개최하는 자체 개발자대회를 통해 새로운 멀티모달 AI 프로젝트를 선보일 것으로 알려졌다. 앞서 오픈AI는 올해 9월 이미지 생성 AI ‘달리’의 세 번째 버전 ‘달리 3’을 공개하면서 챗GPT와 통합시킨 바 있다. 누구나 텍스트 입력만으로 AI 아티스트가 될 수 있도록 지원한 것이다. 이에 6일 공개될 멀티모달 AI에 세간의 관심이 집중되고 있다. 특히 멀티모달 AI가 산업 현장에 본격적으로 접목될 경우 파급력이 클 것으로 전망된다. LG 초거대 AI ‘엑사원 2.0’ 기반 멀티모달 AI 플랫폼 ‘아틀리에’가 대표적이다. 이미지를 언어로 표현하고 언어를 이미지로 시각화하는 아틀리에는 LG그룹의 전문 디자이너들이 주로 사용할 것으로 예상된다. 업계 관계자는 “신제품 출시를 앞두고 디지털 마케팅 등 각종 이미지를 만드는 과정에서 인력, 비용, 시간이 굉장히 많이 투입된다”며 “하지만 멀티모달 등 생성형 AI와 협업하면 한 달에 이미지 10개를 만들었던 프로젝트도 10배 가까이 제작분량을 늘릴 수 있다”고 전했다. elikim@fnnews.com 김미희 임수빈 기자
2023-11-01 15:24:43[파이낸셜뉴스] 네이버 인공지능(AI) 검색 ‘에어서치’가 멀티모달 AI를 탑재, 고도화된다. 차세대 검색기술로 꼽히는 멀티모달 AI는 텍스트와 이미지 등 복합정보를 동시에 학습해 사용자가 원하는 결과를 빠르고 효과적으로 찾아주는 AI 모델이다. 네이버는 멀티모달 AI 모델을 자사 딥러닝 기반 이미지 검색 서비스 ‘스마트렌즈’에 적용했다고 28일 밝혔다. 멀티모달 AI를 이용하면 이미지와 텍스트를 조합하는 등 복합 정보를 입력해 정교한 사용자 맞춤검색이 가능하다. 앞서 네이버는 블로그, 카페, 쇼핑, 지식iN, 뉴스 등 수천만이 이용하는 자사 서비스 빅데이터를 학습해 사용자가 입력한 키워드와 검색 결과 매칭 수준이 높은 멀티모달 AI ‘옴니서치(OmniSearch)’를 지난 3월 구축했다. 네이버는 우선 스마트렌즈에 옴니서치를 적용했다. 스마트렌즈는 사용자들이 검색하고 싶은 이미지를 촬영하면, 쇼핑, 문자인식, 와인라벨 등 다양한 주제에 특화된 검색을 가능하게 하는 서비스다. 멀티모달 AI가 적용된 스마트렌즈에서는 ‘+검색어 추가’ 기능을 통해 이미지촬영 후 텍스트를 추가로 입력해 더욱 구체화된 정보를 찾을 수 있게 된다. 예를 들어 특정 신발 이미지를 검색한 후 텍스트로 색상, 디자인, 소재 등 사용자 기호에 따른 추가 검색어를 더해 찾고자 하는 제품군을 좁혀가는 형태다. 현재 ‘스니커즈(sneakers)’ 카테고리부터 사용 가능하며, 추후 다양한 카테고리로 적용 범위가 확대된다. 연내 쇼핑검색을 비롯해 네이버 검색 전반에 도입, 차별화된 검색 환경을 구축하는 것을 목표로 하고 있다. 특히 네이버는 방대한 쇼핑 빅데이터를 기반으로 구축된 옴니서치가 적용되면 쇼핑 분야에 특화된 검색 서비스 제공이 가능해질 것으로 전망하고 있다. 네이버 서치 사내독립기업(CIC) 강유훈 책임리더는 “멀티모달 AI에 대한 국내외 관심이 높아지는 가운데 네이버 멀티모달 AI모델인 옴니서치를 스마트렌즈에 우선 적용해 선보이게 됐다”며 “앞으로도 AI 검색 에어서치를 고도화한 다양한 검색 서비스를 통해 사용자가 실생활에서 네이버 AI 기술력을 체감할 수 있는 AI 일상화를 선도해 나갈 계획이다”고 밝혔다. 한편 네이버는 오는 5월 3일 차세대 AI 검색을 만나볼 수 있는 ‘네이버 검색 콜로키움 2022’를 온라인으로 개최한다. 이날 행사에는 학계 및 산업계 검색 및 AI 분야 연구자와 함께 최신 연구 성과와 기술 트렌드를 공유하는 자리가 마련되며 멀티모달 AI 모델에 대한 발표도 진행된다. 특히 네이버는 양질의 데이터를 기반으로 구축한 자사 멀티모달 AI 모델 옴니서치 개발과정과 검색 서비스 적용 노하우 등도 공개할 예정이다. elikim@fnnews.com 김미희 기자
2022-04-28 14:51:48LG AI연구원이 서울대와 손잡고 초거대 멀티모달 인공지능(AI) 공동 연구에 착수한다. LG AI연구원은 지난 25일 서울대 AI대학원과 공동으로 'SNU-LG AI 리서치 센터'를 열고 초거대 멀티모달 AI 공동 연구에 나선다고 26일 밝혔다. 서울대학교 관악캠퍼스에 위치한 리서치 센터는 LG AI연구원과 서울대 AI대학원의 공동 연구 거점으로 이경무 서울대대학원 협동과정 AI 전공 주임교수와 배경훈 LG AI연구원장이 공동 센터장을 맡는다. 리서치 센터는 AI가 가상 공간에서 스스로 3차원(3D)의 신체를 생성하고 움직임을 구현할 수 있는 3D 생성기술 등 텍스트, 이미지와 같은 2차원 정보를 다루고 표현하는 기존 초거대 AI의 한계를 뛰어 넘는초거대 멀티모달 AI 핵심 기술을 연구한다. 최해천 서울대 연구부총장은 "LG AI연구원과 긴밀하게 협력해 세계적 수준의 초거대 멀티모달 AI 연구개발을 선도하고 국가 AI 핵심 인재 양성에 주도적인 역할을 할 것"이라고 말했다. 배경훈 LG AI연구원장은 "최고 수준의 AI 연구 역량을 보유한 서울대와 함께 세상에 없던 새로운 AI 기술에 도전하고 멀티모달 AI 공동 연구를 통해 명실 상부한 글로벌초거대 AI 강자로 거듭남과 동시에 우수인재 양성을 위한 노력도 아끼지 않을것"이라고 말했다. LG AI연구원과 서울대는 최근 초거대 멀티모달 AI핵심 기술을 확보하기 위한 8개 공동 연구 과제를 선정했다. 이경무 주임교수는 LG AI연구원과 함께 한 장의 이미지나 짧은 길이의 영상만으로도 특정 인물의 전신 형상 및 움직임을 만들 수 있는 3차원 생성 기술을 연구한다. 다른 공동 연구 주제로는 인간의 언어 학습 구조를 모사한 차세대 언어모델이 있다. LG AI연구원과 서울대는 학습된 정보뿐 아니라 외부 정보를 스스로 학습한 뒤 종합 판단하는, 인간의 언어 학습 구조를 닮은 AI를 개발할 예정이다. ahnman@fnnews.com 안승현 기자
2022-04-26 18:10:24[파이낸셜뉴스] LG AI연구원이 서울대와 손잡고 초거대 멀티모달 인공지능(AI) 공동 연구에 착수한다. LG AI연구원은 지난 25일 서울대 AI대학원과 공동으로 'SNU-LG AI 리서치 센터'를 열고 초거대 멀티모달 AI 공동 연구에 나선다고 26일 밝혔다. 서울대학교 관악캠퍼스에 위치한 리서치 센터는 LG AI연구원과 서울대 AI대학원의 공동 연구 거점으로 이경무 서울대대학원 협동과정 AI 전공 주임교수와 배경훈 LG AI연구원장이 공동 센터장을 맡는다. 리서치 센터는 AI가 가상 공간에서 스스로 3차원(3D)의 신체를 생성하고 움직임을 구현할 수 있는 3D 생성기술 등 텍스트, 이미지와 같은 2차원 정보를 다루고 표현하는 기존 초거대 AI의 한계를 뛰어 넘는초거대 멀티모달 AI 핵심 기술을 연구한다. 최해천 서울대 연구부총장은 "센터 개원으로 초거대 AI 상용기술 연구를 위한 기반을 마련했다"며 "LG AI연구원과 긴밀하게 협력해 세계적 수준의 초거대 멀티모달 AI 연구개발을 선도하고 국가 AI 핵심 인재 양성에 주도적인 역할을 할 것"이라고 말했다. 배경훈 LG AI연구원장은 "최고 수준의 AI 연구 역량을 보유한 서울대와 함께 세상에 없던 새로운 AI 기술에 도전하고 멀티모달 AI 공동 연구를 통해 명실 상부한 글로벌초거대 AI 강자로 거듭남과 동시에 우수인재 양성을 위한 노력도 아끼지 않을것"이라고 말했다. LG AI연구원과 서울대는 최근 초거대 멀티모달 AI핵심 기술을 확보하기 위한 8개 공동 연구 과제를 선정했다. 이경무 주임교수는 LG AI연구원과 함께 한 장의 이미지나 짧은 길이의 영상만으로도 특정 인물의 전신 형상 및 움직임을 만들 수 있는 3차원 생성 기술을 연구한다. 다른 공동 연구 주제로는 인간의 언어 학습 구조를 모사한 차세대 언어모델이 있다. LG AI연구원과 서울대는 학습된 정보뿐 아니라 외부 정보를 스스로 학습한 뒤 종합 판단하는, 인간의 언어 학습 구조를 닮은 AI를 개발할 예정이다. 한편, LG AI연구원은 3년간 1200억원 이상을 투자해 개발하고 있는 국내 최고 성능의 초거대 AI '엑사원'을 지난해 12월 공개하고, 올해 2월에는 구글·우리은행·EBS 등 국내외대표 기업 12개사와 손잡고 이종산업 간 첫 민간 초거대 AI 연합체인'엑스퍼트 AI 얼라이언스(ExpertAI Alliance)'를 발족하며 글로벌 초거대 AI 기술 주도권 선점에 나섰다. ahnman@fnnews.com 안승현 기자
2022-04-26 12:05:06[파이낸셜뉴스] 인공지능(AI) 뉴스 추천 앱 ‘오늘의 헤드라인’의 운영사 빅펄이 콘텐츠 분석 및 추천 모델로 AI 연구를 진행해 ‘멀티모달 콘텐츠 분석 시스템 및 그 방법’이라는 이름으로 원천기술 특허를 등록했다고 12일 밝혔다. 멀티모달 콘텐츠 분석 시스템은 미디어 채널을 통해 업로드된 대량의 콘텐츠를 AI알고리즘을 통해 분석하는 인공지능 기술 기반 시스템이다. 멀티모달 분석 시스템으로 콘텐츠를 분석하는 방법은 크게 4단계이다. △콘텐츠에서 이미지·텍스트 등의 데이터를 수집 △수집된 데이터를 딥러닝 모델을 통해 학습할 수 있는 형태로 전처리 △데이터로 수백 차원의 콘텐츠 임베딩을 학습 △콘텐츠를 분류·분석하는 등으로 단계가 구성돼 있다. 빅펄은 이 기술을 오늘의 헤드라인의 뉴스 추천 알고리즘에 적용해 콘텐츠에 대한 풍부한 이해를 바탕으로 정확하게 사용자의 관심사를 찾아 추천한다. 실제로 오늘의 헤드라인은 뉴스와 소비자를 관심사 네트워크로 연결하고 있다. 하루에도 수많은 콘텐츠가 생성되는 가운데, 콘텐츠를 실시간으로 분석하고 시시각각 변하는 이용자의 관심사를 빠르게 학습해 관심도 높은 뉴스부터 먼저 제공한다. 이 같은 기술력과 이용자 편의성 증대로 가시적인 성과를 보여주고 있다. ‘오늘의 헤드라인’ 앱 이용자가 급증하는 추세로, 지난해 11월 소프트 론칭해 8개월여 만에 25만 다운로드를 돌파했으며 지난 6월 구글 플레이스토어와 애플 앱스토어에서 뉴스 카테고리 1위를 차지한 바 있다. 많은 언론사들의 제휴 문의도 들어오고 있다. 언론사들은 양질의 뉴스 콘텐츠를 생산하고 있지만 소비자에게 접근성이 다소 떨어져 어려움을 겪고 있고, 이러한 문제점을 ‘오늘의 헤드라인’이 해결할 수 있기 때문이다. 오늘의 헤드라인은 언론사 및 관련 단체 등과의 활발한 논의를 통해 뉴스 생산 주체와 소비 주체를 연결하는 혁신을 함께 고민하고 있으며, 미디어의 디지털 트랜스포메이션과 수익화에 도움을 줄 수 있을 것으로 예상된다. vrdw88@fnnews.com 강중모 기자
2021-08-12 10:12:40