【실리콘밸리=홍창기 특파원】오픈AI가 동영상 생성 인공지능(AI) 모델 '소라'(Sora) 정식 모델을 내놨다. 지난 2월 소라를 처음으로 공개한 지 10개월 만이다. 오픈AI는 그동안 일부 이용자들을 대상으로 이 AI 모델을 테스트 해왔다. 샘 올트먼 오픈AI 최고경영자(CEO)는 9일(현지시간) 온라인으로 '소라'의 기능을 시연하고 두 이미지를 결합해 동영상을 생성하는 '블렌드'(Blend) 기능 등을 선보였다. 오픈AI는 텍스트와 이미지, 비디오를 '소라'에 더 쉽게 입력할 수 있도록 새로운 인터페이스를 개발했다. 스토리보드 도구를 사용하면 각 프레임에 대한 입력을 정확하게 지정할 수 있다. 이날 공개된 소라는 지난 2월에 미리 선보인 모델보다 훨씬 더 빠른 속도를 자랑했다. '소라' 이용자는 최대 1080p 해상도, 최대 20초 길이, 와이드스크린, 세로 또는 정사각형 화면 비율로 동영상을 생성할 수 있다. 또 자신만의 자산을 가져와 확장, 리믹스, 블렌딩하거나 텍스트에서 완전히 새로운 콘텐츠를 만들 수 있다. 오픈AI는 "소라는 현실을 이해하고 시뮬레이션하는 AI의 기초 역할을 하며 물리적 세계와 상호 작용할 수 있는 모델을 개발하는 데 중요한 단계다"고 밝혔다. 이어 "당신의 상상을 텍스트나, 이미지, 동영상으로 구현할 수 있다"고 강조했다. 소라는 미국 등 대부분의 국가에서 이날부터 이용할 수 있다. 소라는 챗GPT 플러스 및 챗GPT 프로에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다고 오픈AI는 덧붙였다. 유럽연합(EU)과 영국은 제외됐다. EU와 영국에서의 출시 일정은 정해지지 않았다. 이 지역에서 테크 기업에 대한 규제가 강화하고 있는 데 따른 것으로 보인다. theveryfirst@fnnews.com 홍창기 기자 theveryfirst@fnnews.com 홍창기 기자
2024-12-10 07:45:51[파이낸셜뉴스] 오픈AI의 동영상 생성 인공지능(AI) 모델 ‘소라’(Sora)를 무료로 이용하는 방법이 외신을 공유되고 있다. 마이크로소프트(MS) 검색 엔진 빙(Bing)을 통해서다. 3일 테크크런치에 따르면 MS는 검색엔진 빙 앱에 동영상 생성 기능 ‘빙 비디오 크리에이터’를 도입한다고 밝혔다. 이 기능은 오랜 파트너십을 맺고 있는 오픈AI의 소라 모델을 활용한 것으로, 텍스트를 입력하면 동영상을 자동 생성해준다. 오픈AI 소라의 API를 연결하는 방식으로 이용자들을 끌어들여 검색시장 점유율을 높이려는 전략으로 보인다. 일반 사용자들이 오픈AI의 소라를 사용하려면 월 20달러의 챗GPT 플러스를 쓰거나 월 200달러의 챗GPT 프로를 써야만 했다. 하지만 이번 MS 빙과 통합을 통해 무료로도 쓸 수 있게 된 것이다. 무제한 무료는 아니다. 모든 사용자는 MS 계정에 로그인만 하면 빙 앱을 통해 10개까지 동영상을 무료로 만들 수 있다. 이후부터는 영상 1개당 MS 스토어에서 구매하거나 적립할 수 있는 리워드 포인트가 필요하다. 사용자는 한 번에 최대 3개의 5초짜리 영상을 생성할 수 있다. 프레임은 9 대 16 비율의 세로 영상이 가능하다. MS는 이후 16 대 9 비율의 가로 영상 생성도 지원할 예정이다. ksh@fnnews.com 김성환 기자
2025-06-03 15:12:02구글이 최근 선보인 차세대 인공지능(AI) 동영상 생성 모델 '비오 2(Veo 2)'가 동영상 AI 생성 기술을 한층 끌어올린 것으로 평가받으며 업계에서 화제가 되고 있다. 유료 구독 모델인 제미나이 어드밴스드 이용자를 대상으로 우선 공개된 비오 2는 마치 실제 촬영 영상처럼 자연스러운 결과물을 만들어낼 수 있다. 다만 빅테크들이 앞다퉈 영상 생성 AI 모델을 내놓으며 경쟁이 치열해지는 가운데 저작권 문제에 대한 논의가 먼저 이뤄져야 한다는 지적도 나온다. ■실황공연 연상케 하는 현장감 실려22일 기자가 직접 비오 2를 사용해 영상을 제작해 본 결과 모델은 피사체의 움직임이나 빛의 상호작용 등 물리적 현실성을 구현할 수 있었다. '한국에 내한 온 밴드의 내한 공연 실황에 수많은 군중'이라는 명령어로 동영상을 생성해달라고 하자 실제 저화질 카메라로 관중석에서 찍은 듯한 영상을 내놨다. 그간 오픈AI의 동영상 생성 모델 '소라(Sora)' 등은 물리 현상 표현이 자연스럽지 않았다. 이에 비해 비오2는 다른 영상 AI 모델이 종종 노출했던 어색함이 줄어들어 보다 '진짜 같은' 영상을 2분 내로 손쉽게 만들어냈다. 한계점도 명확해 보인다. 현재로서는 최대 8초 분량의 짧은 영상 클립만 만들 수 있다. 화질도 떨어져 콘텐츠로 사용하기엔 무리가 있었다. 또 하루 5개 내외의 동영상만 생성 가능하다보니, 다양한 시도를 할 수 없었다. 또 안전성을 문제로 실존 인물 등을 언급하면 동영상 생성이 제한됐으나 정확히 어떤 명령어(프롬프트)가 문제인지 알 수는 없었다. 향후 기술 업데이트를 통해 생성 가능한 영상 길이가 늘어날 것으로 기대된다. 업계에서는 비오 2의 뛰어난 성능 배경에 구글의 방대한 유튜브 영상 데이터가 활용됐을 가능성이 높다고 보고 있다. 수십억 개에 달하는 유튜브 영상 데이터 학습을 통해 실제와 유사한 수준의 영상 생성 능력을 확보했을 것이라는 분석이다. ■저작권 침해 커질 수도다만 방대한 데이터를 학습하는 과정에서 원저작자의 동의 없이 콘텐츠가 사용될 경우 심각한 저작권 침해 문제를 야기할 수 있다는 지적도 나온다. 앞서 챗GPT를 이용한 '지브리풍' 이미지 만들기가 인기를 끌자 지브리 스튜디오와의 저작권 분쟁 우려가 나오는 상황이다. 특정 형태의 화풍이 직접적인 저작권 침해에 해당하지는 않지만, AI 모델이 다른 창작자의 작품을 무단 학습했다면 이는 저작권 침해 가능성이 높다. 영상 업계에서는 AI 영상 저작권 논의가 보다 활발하게 이뤄져야 한다고 주장한다. AI가 짧은 영상이나 광고 시장을 대체할 것으로 예상되기 때문이다. 한 영상업계 관계자는 "동영상 AI가 더 발전한다면 '지브리풍' 이미지 논란 처럼 '봉준호 감독풍'이나 '애플 광고풍' 영상을 AI로 그럴듯하게 제작하는 것이 가능해질 것"이라며 "창작자들의 저작권은 물론 영상 기술자들의 생존 문제에도 직결될 수 있는 만큼 분명한 가이드라인이 필요하다"고 말했다. 한편, 빅테크 기업들은 AI 기반 동영상 생성 기능의 폭넓은 활용 가능성에 주목해 다양한 모델을 내놓고 있다. 오픈 AI의 소라를 포함해 아마존웹서비스(AWS)는 '노바 릴(Nova Reel)', 메타의 '무비젠(Movie Gen)' 등을 선보이고 계속 모델을 고도화하고 있다. 일론 머스크가 이끄는 AI 스타트업 xAI도 지난달 AI 기반 영상 자동 생성 스타트업 '핫샷(hotshot)'을 인수하면서 영상 생성 AI 모델을 내놓을 것으로 예상된다. wongood@fnnews.com 주원규 기자
2025-04-22 18:07:16[파이낸셜뉴스] 구글이 최근 선보인 차세대 인공지능(AI) 동영상 생성 모델 '비오 2(Veo 2)'가 동영상 AI 생성 기술을 한층 끌어올린 것으로 평가받으며 업계에서 화제가 되고 있다. 유료 구독 모델인 제미나이 어드밴스드 이용자를 대상으로 우선 공개된 비오 2는 마치 실제 촬영 영상처럼 자연스러운 결과물을 만들어낼 수 있다. 다만 빅테크들이 앞다퉈 영상 생성 AI 모델을 내놓으며 경쟁이 치열해지는 가운데 저작권 문제에 대한 논의가 먼저 이뤄져야 한다는 지적도 나온다. 실황공연 연상케 하는 현장감까지 살려22일 기자가 직접 비오 2를 사용해 영상을 제작해 본 결과 모델은 피사체의 움직임이나 빛의 상호작용 등 물리적 현실성을 구현할 수 있었다. '한국에 내한 온 밴드의 내한 공연 실황에 수많은 군중'이라는 명령어로 동영상을 생성해달라고 하자 실제 저화질 카메라로 관중석에서 찍은 듯한 영상을 내놨다. 그간 오픈AI의 동영상 생성 모델 '소라(Sora)' 등은 물리 현상 표현이 자연스럽지 않았다. 이에 비해 비오2는 다른 영상 AI 모델이 종종 노출했던 어색함이 줄어들어 보다 '진짜 같은' 영상을 2분 내로 손쉽게 만들어냈다. 한계점도 명확해 보인다. 현재로서는 최대 8초 분량의 짧은 영상 클립만 만들 수 있다. 화질도 떨어져 콘텐츠로 사용하기엔 무리가 있었다. 또 하루 5개 내외의 동영상만 생성 가능하다보니, 다양한 시도를 할 수 없었다. 또 안전성을 문제로 실존 인물 등을 언급하면 동영상 생성이 제한됐으나 정확히 어떤 명령어(프롬프트)가 문제인지 알 수는 없었다. 향후 기술 업데이트를 통해 생성 가능한 영상 길이가 늘어날 것으로 기대된다. 업계에서는 비오 2의 뛰어난 성능 배경에 구글의 방대한 유튜브 영상 데이터가 활용됐을 가능성이 높다고 보고 있다. 수십억 개에 달하는 유튜브 영상 데이터 학습을 통해 실제와 유사한 수준의 영상 생성 능력을 확보했을 것이라는 분석이다. 저작권 침해 커질 수도다만 방대한 데이터를 학습하는 과정에서 원저작자의 동의 없이 콘텐츠가 사용될 경우 심각한 저작권 침해 문제를 야기할 수 있다는 지적도 나온다. 앞서 챗GPT를 이용한 '지브리풍' 이미지 만들기가 인기를 끌자 지브리 스튜디오와의 저작권 분쟁 우려가 나오는 상황이다. 특정 형태의 화풍이 직접적인 저작권 침해에 해당하지는 않지만, AI 모델이 다른 창작자의 작품을 무단 학습했다면 이는 저작권 침해 가능성이 높다. 영상 업계에서는 AI 영상 저작권 논의가 보다 활발하게 이뤄져야 한다고 주장한다. AI가 짧은 영상이나 광고 시장을 대체할 것으로 예상되기 때문이다. 한 영상업계 관계자는 "동영상 AI가 더 발전한다면 '지브리풍' 이미지 논란 처럼 '봉준호 감독풍'이나 '애플 광고풍' 영상을 AI로 그럴듯하게 제작하는 것이 가능해질 것"이라며 "창작자들의 저작권은 물론 영상 기술자들의 생존 문제에도 직결될 수 있는 만큼 분명한 가이드라인이 필요하다"고 말했다. 한편, 빅테크 기업들은 AI 기반 동영상 생성 기능의 폭넓은 활용 가능성에 주목해 다양한 모델을 내놓고 있다. 오픈 AI의 소라를 포함해 아마존웹서비스(AWS)는 '노바 릴(Nova Reel)', 메타의 '무비젠(Movie Gen)' 등을 선보이고 계속 모델을 고도화하고 있다. 일론 머스크가 이끄는 AI 스타트업 xAI도 지난달 AI 기반 영상 자동 생성 스타트업 '핫샷(hotshot)'을 인수하면서 영상 생성 AI 모델을 내놓을 것으로 예상된다. wongood@fnnews.com 주원규 기자
2025-04-22 16:10:13마이크로소프트(MS) 사티아 나델라 최고경영자(CEO)가 방한 일정 중 국내 AI 엔터테크 스타트업 갤럭시코퍼레이션과 비공개 간담회를 갖고 “상상의 선구자”라며 극찬을 아끼지 않았다. 서울 양재동 aT센터에서 열린 'MS AI 서밋'에 앞서 마련된 이번 만남은 정해진 아젠다 없이 자유롭게 진행됐다. 나델라 CEO는 갤럭시코퍼레이션이 제작해온 AI 망자 콘텐츠와 향후 계획 중인 글로벌 AI 망자 스튜디오에 깊은 관심을 보이며, “인생과 수명의 한계를 초월하는 개념을 정립한 것은 대단하다”라고 평가했다. 특히 “기억을 단순히 추억으로 저장하는 것이 아니라 살아 숨 쉬는 생명체처럼 활용할 수 있는 형태로 구현하려는 발상은 아름다운 아이디어”라고 강조하며, AI를 통해 인간의 기억을 포착하고 재구성하는 미래 지향적 콘텐츠 가능성에 주목했다. 갤럭시코퍼레이션은 생전 연예인의 목소리, 표정, 특징 등을 AI로 복원해 공연 및 영상 콘텐츠로 구현하는 AI 기반 망자 콘텐츠 ‘아바드림’을 선보인 바 있다. 이에 대해 최용호 대표는 “지금까지는 높은 제작비로 특정인에게만 제공할 수 있었지만, MS와의 협업을 통해 AI 기술을 전 세계 80억 인구 모두가 누릴 수 있도록 확장하길 기대한다”고 화답했다. 이번 만남은 단순한 인사 차원을 넘어, 양사 간 향후 협력 가능성을 가늠하는 상징적 교류로 평가받는다. 나델라 CEO는 “AI로 이뤄내야 할 가장 중요한 혁신이 이런 파트너십 속에서 나올 수 있다”며 갤럭시코퍼레이션의 IP, 테크, 미디어 융합 모델에 깊은 인상을 남겼다. 앞서 갤럭시코퍼레이션은 MS가 주최한 ‘스타트업 커넥션’ 행사에서도 공식 선정한 ‘AI 스타트업’으로 발표되며 기술력을 인정받았다. 특히 글로벌 아티스트 지드래곤이 소속된 이 회사는 미국 라스베이거스의 대형 공연장 ‘스피어’에서 AI 기술 기반 공연을 추진 중이며, MS의 동영상 생성 AI ‘소라(Sora)’를 활용한 뮤직비디오 제작 협업도 논의한 것으로 알려졌다. 업계는 이번 만남을 통해 한국 AI 스타트업의 글로벌 경쟁력을 다시금 확인하는 계기가 됐다고 평가하고 있다. 한 AI 업계 관계자는 “MS의 AI 투어는 세계적으로 진행되지만, CEO가 직접 참석하는 국가는 손에 꼽힌다”며 “이번 방한은 한국의 AI 생태계에 대한 MS의 전략적 관심을 보여주는 것”이라고 분석했다.
2025-03-26 17:52:41【실리콘밸리=홍창기 특파원】 오픈AI가 자사 이미지 생성 인공지능(AI) 모델 '달리'(DALL-E)3 을 '챗GPT 4o(오) 이미지 제네레이션'(ChatGPT 4o Image Generation·이하 챗GPT 이미지)로 대체한다. '챗GPT 이미지'는 오픈AI의 생성형 AI 모델 'GPT-4'의 텍스트 이해 능력과 고급 이미지 생성 기능이 탑재돼 작용한다. 때문에 '챗GPT이미지'는 '달리3'보다 훨씬 더 복잡하고 까다로운 이용자가 원하는 정확한 이미지를 생성할 수 있다. 사용자가 원하는 복잡한 이미지 그대로 생성 오픈AI는 25일(현지시간) 한국 특파원들과 브리핑을 갖고 '챗GPT이미지'를 새롭게 선보인다고 발표했다. 오픈AI는'챗GPT이미지'는 지난 2023년 9월에 공개된 '달리'3 이후 1년 6개월 만에 오픈AI가 새롭게 선보이는 이미지 생성 AI 모델이다. 구체적인 프롬프트를 일일이 입력해도 '달리3'은 사용자의 니즈를 100% 반영하지 못해 그동안 업그레이드 필요성이 제기돼 왔는데 '챗GPT이미지'는 '달리3'보다 기능이 크게 진보했다는 것이 오픈AI의 설명이다. 오픈AI는 지난 2021년 1월 달리를 처음 출시했고 지난 2022년 4월 개선된 '달리 2'를 내놓은 후 지속적으로 이미지 생성 AI를 업그레이드하는 중이다. 오픈AI는 '챗GPT이미지'가 '달리3'를 완전히 대체한다고 설명했다. 다만 '달리3'에 익숙한 이용자를 위해 '달리3' 서비스는 시간을 두고 중지딘다. 오픈AI에서 멀티모달(Multimodal·텍스트, 이미지, 오디오 동시처리) 업무를 담당하고 있는 직원 가브리엘 고는 "'챗GPT이미지'는 '달리'3의 업그레이드 버전이 아닌 완전히 다른 이미지 생성 AI 모델이다"라고 강조했다. '챗GPT이미지'가 오픈AI의 이미지 생성 AI 모델이 참신함에서 실용적으로 전환시킨다는 설명이다. 특히 사용자의 복잡한 다단계 지시를 따르는 것이 가장 큰 장점이다. 사용자가 '파란색 별과 빨간색 삼각형'이라는 프롬프트를 챗GPT에 입력하면 '챗GPT이미지'가 이 객체의 속성을 올바르게 반영해 사용자가 원하는 정확한 이미지를 만들어내는 식이다. 오픈AI는 "'챗GPT이미지'를 테스트한 결과 이 모델은 최대 15가지의 사용자가 원하는 물체를 정확하게 생성할 수 있는 것으로 나타났다"고 설명했다. 이어 "이는 기존 모델인 '달리3'의 성능을 능가하는 것이다"고 덧붙였다. 효과적인 교육자료 만드는데도 손색없어 '챗GPT이미지'는 '달리3'과 달리 상식에서 벗어난 이미지 생성에서도 어려움을 겪지 않는다. 오픈AI에서 멀티모달 업무를 담당하는 또 다른 직원 재키 새넌은 "'챗GPT이미지'는 삼각형 바퀴가 달린 자전거를 그려달라는 프롬프트가 입력되면 '달리3'처럼 버벅되지 않고 삼각형 바퀴가 달린 이미지를 바로 생성해 낸다"고 설명했다. 또 정확한 텍스트와 캐릭터 배치를 활용해 네컷 만화를 생성하고 물리학자 뉴턴의 기존 프리즘 실험 이미지도 다양하게 활용해 새로운 이미지를 만들어 낸다. 때문에 오픈AI는 '챗GPT이미지'의 뛰어난 기능이 교육 자료나 그래픽 자료로 유용하게 활용될 수 있을 것이라고 기대했다. 이와 관련, '챗GPT이미지'는 교육용 포스터를 위한 푸른색의 대왕고래 등 8가지의 종류의 고래를 색이 틀리지 않게 올바르게 생성해냈다. 새넌은 "챗GPT 이미지로 AI는 단순히 재미있는 특수효과를 만들어 내지 않고 실용적인 도구가 될 것이다"라고 내다봤다. 이어 "오픈AI가 누구나 쉽고 자세하고 정확한 시각 자료를 만들 수 있는 가능성을 열어서 기쁘다"라고 덧붙였다. '챗GPT이미지'는 오픈AI 이용자라면 누구나 무료로 챗GPT를 통해 사용할 수 있다. 또 오픈AI의 동영상 생성 AI 모델 소라(Sora)에서도 '챗GTP이미지'가 활용된다. '챗GPT이미지'는 한국어에도 응답한다. 다만 영어처럼 한국어로도 '챗GPT이미자'가 잘 작동할 지는 미지수다. 오픈AI측은 "앞으로 한국어 등 다른 언어로도 '챗GPT이미지'가 정확하게 작동할 수 있도록 업데이트 해 날 것"이라고 전했다. theveryfirst@fnnews.com 홍창기 기자
2025-03-26 01:40:50바야흐로 멀티모달 인공지능의 시대다. 글을 쓰면 그림·소리·영상이 되고, 물론 다른 방향의 변환도 가능하다. 오픈AI의 동영상 제작 인공지능 소라(Sora)나 구글 딥마인드의 Veo2를 보면 우리가 프롬프트 창에 두서없이 적어넣은 이야기를 충실히 반영해 그럴듯한 동영상을 만들어 낸다. 빛, 그림자, 움직임과 같은 표현력은 상당한 수준에 이르렀다. 신소재, 화학, 로봇 공학 분야에서는 인공적인 미각, 후각, 촉각을 세운다. 인공지능이 빠르게 영역을 넓혀가니 많은 이들은 가까운 미래에 인공지능으로 대체될 직업을 경쟁적으로 예측한다. 예측이 워낙 다양해서 누군가 한 명은 맞힐 것 같다. 한편 최근 비즈니스 인사이더의 기사를 보면 소라의 성능 한계를 지적하며 당장은 영화산업이 대체되지 않을 거라며 자기 위안한다. 물론 이러한 수요자 중심의 질문들은 사업 방향을 결정하는 데 중요한 이슈이긴 하다. 이제는 질문도 예측도 어느 정도 수렴한 듯하고, 석학들의 답변도 우리가 생각하는 범위에서 크게 벗어나지 않는다. 이제는 인공지능 활용과 한계에 대한 표면적 논의를 넘어 조금 더 근본적인 질문을 해보자. 생성 인공지능은 인간이 만들어 낸 데이터로부터 무엇을 배웠으며, 우리는 인공지능이 학습한 지식을 어떻게 해석해야 할까. 생성 인공지능은 우선 데이터에서 생성에 필요 없는 잡음을 걷어내어 함축된 해석을 하고, 이를 바탕으로 원본 데이터를 생성한다. 디퓨전(Diffusion) 모델과 같은 최신 기술에서는 데이터에 잡음이 섞이는 과정을 거꾸로 학습하여 잡음을 걷어내기도 한다. 이렇게 학습된 인공지능은 원본 데이터 사이의 애매한 영역을 표현하는 '내삽'(Interpolation)을 할 수 있고, 더 나아가 학습영역 바깥의 세상을 예측해 내는 '외삽'(Extrapolation) 능력도 생긴다. 멀티모달 데이터의 내삽은 오감을 배우는 과정과 유사하고, 오감을 외삽하는 능력은 육감에 빗대어 볼 수 있다. 이제 인공지능을 인간의 관점에서 해석해 보자. 인공지능은 위와 같은 학습 과정을 통해 다양한 데이터가 가진 표면적 패턴 속에 숨겨진 원리에 접근한다. 인간이 만들어 낸 데이터를 자유롭게 내삽하는 인공지능은 인류 지식을 관통하는 관점을 보여주는 현미경이 되고, 외삽의 인공지능은 인류 지식의 경계 너머를 내다볼 수 있는 망원경이 된다. 자연이 만들어 낸 데이터를 내삽하는 인공지능은 세상을 지배하는 물리적인 법칙을 보여줄 것이고, 외삽을 통해 새로운 상황에서 직관적이고 물리적인 예측을 할 수 있을 것이다. 정작 인공지능은 아무런 의도도, 거창한 계획도 없는데 우리 입맛에 맞춰 과하게 해석하는 인지적 오류는 아닐까. 하지만 인공지능은 우리의 해석과 무관하게, 그리고 그것의 의도의 유무와 관계없이 오감의 경계를 넘나들며 차근차근 학습해 나가고 있다. '쎄한' 분위기를 알아차리지 못해 억울한 나와 달리 오감의 마스터가 된 생성 인공지능에 "이번 역은 오감, 오감역, 내리실 문은 '육감'입니다." 로버트 프로스트의 시 '가지 않은 길'에서는 기회와 선택에 대한 인간적 고민을 이야기한다. 문과로 진학하여 문학 속 길잡이가 될 것인가, 공대로 진학하여 엔지니어가 될 것인가, 의대로 진학하여 의료인이 될 것인가. 그런데 생성 인공지능에 이러한 고민은 별 의미 없어 보인다. 어떤 인공지능은 이미지를 전공하고, 어떤 인공지능은 소리나 영상을 전공하며 제각기 다른 데이터를 학습하기 시작했지만 배움의 길이 다시 만나는 곳에서 그들이 마주한 깨달음 속에는 전공의 구분이 없다. 인공지능이 의사면허 시험에 합격한 건 이미 오래전 이야기가 됐고 최근 오픈 AI가 공개한 인공지능 o3는 과학, 수학, 코딩 등 다양한 학문분야에서 뛰어난 추론능력을 보여준다. 오감의 경계 없는 인공지능이 추론까지 잘한다면? 그때는 육감과 직관의 영역에 도달했다고 인정해 주자. 그리고 우리의 상상력으로 인공지능의 육감과 직관을 품는 순간, "월터의 상상은 현실이 된다." 이상완 KAIST 뇌인지과학과 부교수·신경과학-인공지능 융합연구센터장
2025-01-02 18:27:13실리콘밸리의 세밑은 조용하다 못해 평온했다. 지난 2024년 한 해에도 전 세계가 주목하지 않으면 안되는 혁신을 거듭했던 곳답지 않게 말이다. 요란한 실리콘밸리만의 새해 축하 문화도 없고 애플 등 빅테크가 크리스마스를 시작으로 새해 초까지 휴가 체제에 있어서다. 연말연초 실리콘밸리는 고요했지만 물밑에서 또 한번 혁신을 통한 도약을 할 채비를 하고 있는 것처럼 보인다. 매년 그래 왔듯이 말이다. 지난 2024년에도 실리콘밸리의 혁신은 전 세계를 놀라게 했다. 그 중심에는 게임용 그래픽처리장치(GPU)를 생산했던 엔비디아가 있다. 엔비디아는 오픈AI와 더불어 전 세계 인공지능(AI) 흐름을 선도하는 기업으로 자리 잡았다. 2024년 3월 엔비디아 젠슨 황 최고경영자(CEO)는 AI 종합기업으로 도약을 선언했다. 단순하게 AI 칩을 생산하는 기업이 아닌 AI 소프트웨어까지 아우르겠다는 것이었다. 가능할까 하는 의견이 많았다. 엔비디아는 '쿠다'라는 엔비디아만의 소프트웨어를 통해 영향력을 확대하고 있다. 젠슨 황 CEO는 자신의 약속을 지키는 중이다. 챗GPT로 전 세계를 AI에 빠져들 수밖에 없게 만들었던 오픈AI도 제자리에 멈춰 있지 않았다. 오픈AI는 인간과 엇비슷한 수준의 AI 범용인공지능(AGI) 출시에 박차를 가하고 있다. 샘 올트먼 CEO는 "AI는 쿨한 것 같다"는 자신의 SNS 문구처럼 AI를 만들기 위해 바쁜 한 해를 보냈다. 연초에 약속했던 생성형 AI 동영상 생성기 소라(Sora) 등의 연내 출시 약속을 지켰다. 올트먼 CEO 역시 거짓말하지 않았다. 메타플랫폼도 혁신의 발걸음을 멈추지 않았다. 지난해 메타 CEO 마크 저커버그는 메타버스에 빠져 회사를 망치고 있다는 투자자들의 비난을 누그러뜨렸다. 저커버그는 메타의 생성형 AI 서비스 메타AI와 스마트글라스로 반전을 꾀했다. 실리콘밸리 혁신의 정점에서 다소 밀려난 구글도 마찬가지다. 10여년 전 세계 최초로 AI를 선보였던 구글은 절치부심했다. 그 결과 제미나이(Gemini)라는 최신형 멀티모달 AI 모델을 내놨다. 여기에 머무르지 않고 순다르 피차이 CEO는 구글의 AI가 오픈AI에 뒤처져 있음을 인정하는 대범함을 보였다. 그는 직원들을 질책하는 대신 독려했다. 전 직원에게 2025년의 구글 목표가 차이를 줄이는 것이라는 명확한 비전도 제시했다. 반면 혁신 없이 안주한 기업들은 몰락했다. 인텔이 그랬다. 인텔은 조 바이든 미국 정부가 '반도체 챔피언'이라고 찬사를 보냈던 기업이다. 실제로도 인텔은 과거 최고의 반도체 기업이었다. 하지만 혁신을 등한시한 인텔은 뒤처졌다. 세계 2위의 반도체위탁생산(파운드리) 기업이 되겠다던 팻 겔싱어 전 CEO는 거짓말쟁이가 된 채 자리에서 내려왔다. 자칫하면 인텔은 역사의 뒤안길로 사라질 위기다. 과거 실리콘밸리의 모태가 됐던 휴렛팻커드(HP)의 길을 따라갈 수도 있다. 나라가 큰 위기에 처했다. 정치적 불확실성은 경제 불안정으로 이어지고 있다. 두 차례 탄핵을 거쳐 두 번째 대통령 권한대행이 나라를 맡았다. 두 번째 권한대행이 등장하면서 한국의 대외신인도도 부정적으로 바뀌었다. 외국인은 한국 증시에서 자금을 빼내고 있다. 원·달러 환율은 1500원에 육박하고 있다. 1달러에 1400원을 넘는 고환율은 지난 2009년에 겪은 금융위기를 떠오르게 한다. 설상가상으로 불의의 사고까지 겹쳤다. 그럼에도 현재 대한민국에는 실리콘밸리를 대표하는 기업의 CEO처럼 약속을 지키고 비전을 제시하는 정치인들은 보이지 않는 것 같다. 위기를 유리하게 활용하려고만 하는 정치인만 많다. 그런 정치인들은 항상 국민을 얘기하는데, 정작 국민은 피해를 보고 있다. 실리콘밸리의 혁신을 한국 정치에 적용한다면 개혁이 될 것이다. 한국 정치의 개혁이 없다면 대한민국호는 정치적 리스크에 따라 매번 요동칠 것이다. 새해에는 우리 정치인들이 약속을 지키는 모습을 보기를 기원한다. theveryfirst@fnnews.com
2024-12-31 17:34:33#1 오픈AI가 출시한 동영상 제작 AI '소라'(Sora)에 프롬프트(영상 제작 명령어)를 입력해봤다. 성탄절을 맞아 '트리 앞에서 크리스마스 파티를 하고 있는 5마리의 강아지들'이라고 입력한 후 실행 버튼을 눌렀다. 오른쪽 상단에'작업중' 표시가 뜬 지 3분도 되지 않아 5초짜리 동영상이 만들어졌다. #2 구글도 지난 16일 영상 제작 AI '비오2'(VEO2) 데모 영상을 공개했다. 물안경을 쓴 닥스훈트가 물을 채운 풀장 바닥으로 잠수해 움직이는 장면이다. 다이빙하는 순간 발생하는 기포와 함께 수영장 바닥에 복잡하게 일렁이는 수면반사 현상을 완벽하게 표현했다. 글로벌 빅테크 기업들이 앞다퉈 동영상 제작을 위한 생성형 AI를 내놓으면서 '영상 AI 전쟁'이 본격화되고 있다. 기술이 발전하며 '진짜보다 더 진짜 같은' 영상을 누구나 쉽게 제작할 수 있다는 기대감도 커지고 있다. 한편 현재 소라는 챗GPT와 연동돼 요금이 월 최대 200달러에 달해 소비자의 AI 비용 부담이 늘어날 것이라는 전망도 나온다. ■구글·오픈AI·메타 ‘3파전’ 예상25일 정보통신업계에 따르면 △오픈AI의 소라 △구글의 비오2 △메타(옛 페이스북)의 '무비 젠'(Movie Gen) 등 3개가 영상 AI의 3파전을 벌이는 양상이다. 각각 챗GPT, 구글, 인스타그램 등의 기존 이용자를 기반으로 서비스 유입을 빠르게 늘릴 것으로 보인다. 데모 영상이 공개된 비오2는 영상 제작 AI의 품질을 한 단계 끌어올렸다는 평가를 받고 있다. 4K(초고화질) 화질을 지원하고, 2분 이상의 영상을 만들 수 있다. 특히 비오2는 기존 동영상 AI로 구현하기 힘들었던 물리법칙이나 세부적인 묘사를 더 사실적이고 자연스럽게 할 수 있는 강점을 가졌다. 소라는 누구나 쉽게 사용할 수 있다는 강점을 내세워 시장을 선점하고 있다. 텍스트 프롬프트 기반으로 원하는 영상을 설명하면 최대 1080p(고화질) 영상에 20초 분량의 영상을 짧은 시간 안에 만들어준다. 메타가 만든 무비 젠도 자사의 서비스와 연계된다는 점이 가장 중요한 강점으로 보인다. 페이스북과 인스타그램 등을 이용하는 전 세계 이용자들이 쉽고 빠르게 서비스에 접근할 수 있을 것으로 예측된다. 최대 16초 길이의 영상을 만들 수 있는 무비 젠은 영상과 텍스트 프롬프트로 주변 소리, 악기 배경음악, 음향 효과 등을 포함한 최대 45초 길이의 오디오를 생성해낸다. ■생성형 AI 새 먹거리로 부상빅테크들이 너도나도 영상 AI에 뛰어드는 것은 AI 챗봇을 넘어서 '영상 제작 AI'가 다음 먹거리 중 하나가 될 수 있다는 기대감 때문인 것으로 분석된다. 실제 지난 10일 오픈AI가 영상 AI 소라를 상용 서비스로 개방하자 이용자가 몰리면서 일시적으로 서비스 이용이 제한되기도 했다. AI업계에선 생성형 AI만으로는 수익을 내기 어렵다는 지적이 제기돼 왔다. 생성형 AI 시장이 포화상태에 이르면서 가격경쟁이 시작됐기 때문이다. 이 가운데 영상 생성형 AI는 AI업계의 새 수익창출 기반으로 떠오르고 있다. 아울러 기존 자사 서비스에 이용자들을 고정시키는 록인(Lock-in) 효과도 기대할 수 있다. 챗GPT 유료 이용자가 소라를 이용하듯이 비오2도 유튜브 프리미엄, 크리에이터 등 유료 요금제와 연계될 가능성이 높다. 메타 역시 자사의 페이스북, 인스타그램, 등 SNS와 연계해 동영상 제작 기능을 활용하면서 충성도를 끌어올릴 계획이다.■딥페이크 우려 목소리도다만 영상 AI 기술 발전에 따른 부작용을 우려하는 목소리도 높다. 업계에서는 △영화·광고 업계 등 일자리 축소 △영상 저작권 문제 △딥페이크 문제 등을 대표적으로 꼽고 있다. 유현재 서강대 신문방송학과 교수는 "영상 제작 AI가 본격적으로 사용된다면 윤리와 안전 문제가 불거질 것"이라며 "특히 딥페이크를 포함해 '미디어 범죄'로 분류되는 수많은 파생범죄들이 늘어날 것으로 예상된다"고 했다. wongood@fnnews.com 주원규 기자
2024-12-25 18:28:38[파이낸셜뉴스] #. 오픈 AI가 출시한 동영상 제작 AI '소라'(Sora)에 프롬프트(영상 제작 명령어)를 입력해봤다. 성탄절을 맞아 '트리 앞에서 크리스마스 파티를 하고 있는 5마리의 강아지들'이라고 입력한 후 실행 버튼을 눌렀다. 오른쪽 상단에 '작업중' 표시가 뜬지 3분도 되지 않아 5초짜리 동영상이 만들어졌다. 바닥에 널려 있는 선물상자들이 움직이는 모습과 강아지들의 움직임이 부자연스러웠지만, 얼핏 봐서는 AI로 만든 것을 구분하기 힘들 정도였다. 소라는 화면 비율을 정할 수 있고 '스톱모션' '카드보드형' 등 다양한 프리셋 옵션도 선택할 수 있다. #. 구글도 지난 16일 영상 제작 AI '비오2'(VEO2) 데모 영상을 공개했다. 물안경을 쓴 닥스훈트가 물을 채운 풀장 바닥으로 잠수해 움직이는 장면이다. 다이빙 하는 순간 발생하는 기포와 함께 수영장 바닥에 복잡하게 일렁이는 수면반사 현상을 완벽하게 표현했다. 개가 수영장 바닥에 닿는 곳을 진원지 삼아 수면반사 패턴이 퍼져나가 실사 영상을 방불케 했다. 글로벌 빅테크 기업들이 앞다퉈 동영상 제작을 위한 생성형 AI를 내놓으면서 '영상 AI 전쟁'이 본격화되고 있다. 기술이 발전하며 '진짜보다 더 진짜같은' 영상을 누구나 쉽게 제작할 수 있다는 기대감도 커지고 있다. 한편 현재 소라는 챗GPT와 연동돼 요금이 월 최대 200달러에 달해 소비자들의 AI 비용 부담이 늘어날 것이라는 전망도 나온다. 구글 vs 오픈AI vs 메타... '빅테크 3파전' 예상25일 정보통신업계에 따르면 △오픈 AI의 소라 △구글의 비오2 △메타(구 페이스북)의 '무비 젠'(Movie Gen) 등 3개가 영상 AI의 3파전을 띄는 양상이다. 각각 챗GPT, 구글, 인스타그램 등의 기존 이용자를 기반으로 서비스 유입을 빠르게 늘릴 것으로 보인다. 데모 영상이 공개된 비오2는 영상 제작 AI의 품질을 한 단계 끌어올렸다는 평가를 받고있다. 4K(초고화질) 화질을 지원하고, 2분 이상의 영상을 만들 수 있다. 특히 비오2는 기존 동영상 AI로 구현하기 힘들었던 물리법칙이나 세부적인 묘사를 더 사실적이고 자연스럽게 묘사할 수 있는 강점을 가졌다. 가상의 카메라 제어 기능도 사용할 수 있다. 예시로 구글이 공개한 비오2 영상 중 하나는 프롬프트에 '18mm렌즈로 로우 앵글의 트레킹 샷'을 입력하니 실제 렌즈 카메라로 찍은 것과 유사한 분위기의 결과물을 냈다. 구글은 내년 중 유튜브 숏츠(짧은 동영상) 등 제품에 적용될 예정이다. 소라는 누구나 쉽게 사용할 수 있다는 강점을 내세워 시장을 선점하고 있다. 텍스트 프롬프트 기반으로 원하는 영상을 설명하면 최대 1080p(고화질) 영상에 20초 분량의 영상을 짧은 시간 안에 만들어준다. 추천(Featured), 최신(Recent) 피드에서 타인이 만든 프롬프트를 참조할 수 있다. 메타가 만든 '무비 젠'도 자사의 서비스와 연계된다는 점이 가장 중요한 강점으로 보인다. 페이스북과 인스타그램 등을 이용하는 전세계 이용자들이 쉽고 빠르게 서비스에 접근할 수 있을 것으로 예측된다. 최대 16초 길이의 영상을 만들 수 있는 무비 젠은 영상과 텍스트 프롬프트로 주변 소리, 악기 배경 음악, 음향 효과 등을 포함한 최대 45초 길이의 오디오를 생성해낸다. 지난 19일에는 아담 모세리 인스타그램 최고경영자(CEO)가 무비젠을 이용해 영상 속 배경과 의상을 자유자재로 바꿀 수 있는 기능을 공개했다. 영상AI, 생성형 AI 새 먹거리로 부상빅테크들이 너도나도 영상 AI에 뛰어드는 것은 AI 챗봇을 넘어서 '영상 제작 AI'가 다음 먹거리 중 하나가 될 수 있다는 기대감 때문인 것으로 분석된다. 실제 지난 10일 오픈AI가 영상 AI '소라'를 상용 서비스로 개방하자 이용자가 몰리면서 일시적으로 서비스 이용이 제한되기도 했다. 챗GPT 유료 요금제 중에서도 '챗GPT 프로' 요금제가 더 많은 영상 제작을 위한 '크레딧'을 제공하면서 200달러 요금제로 유도하는 효과도 커질 것으로 기대된다. 추후에 추가된 영상 기능을 더 자유롭게 사용하기 위해 더 비싼 요금제를 출시한다는 전망도 나온다. AI업계에선 생성형 AI만으로는 수익을 내기 어렵다는 지적이 제기돼 왔다. 생성AI 시장이 포화상태에 이르면서 가격경쟁이 시작됐기 때문이다. 이 가운데 영상 생성형 AI는 AI업계의 새 수익 창출 기반으로 떠오르고 있다. 기업들도 영상 AI 유료 요금제를 출시하거나, 유료 기능 등을 추가하며 유료화에 나설 전망이다. 아울러 기존 자사의 서비스에 이용자들을 고정시키는 락인(Lock-in) 효과도 기대할 수 있다. 챗GPT 유로 이용자가 소라를 이용하듯이 비오2도 유튜브 프리미엄, 크리에이터 등 유료 요금제와 연계될 가능성이 높다. 메타 역시 자사의 페이스북, 인스타그램, 왓츠앱 등 사회관계망서비스(SNS)와 연계해 동영상 제작 기능을 활용하면서 충성도를 끌어 올린다는 계획이다. 딥페이크 우려 목소리도다만 영상 AI 기술 발전에 따른 부작용을 우려하는 목소리도 높다. 업계에서는 △영화·광고 업계 등 일자리 축소 △영상 저작권 문제 △딥페이크 문제 등을 대표적으로 꼽고 있다. 아직은 실제 영상을 대체할 수 있을 정도의 품질이 보장되지 않고, '워터마크' 삽입 등을 통해 문제에 대처한다는 방침이지만 철저한 대비가 필요하다는 지적이 나온다. 유현재 서강대 신문방송학과 교수는 "영상 제작 AI가 본격적으로 사용된다면 윤리와 안전 문제가 불거질 것"이라며 "특히 딥페이크를 포함해 '미디어 범죄'로 분류되는 수많은 파생 범죄들이 늘어날 것으로 예상된다"고 했다. wongood@fnnews.com 주원규 기자
2024-12-23 16:17:55