멀티모달 인공지능 시대
오감뿐 아니라 추론까지
월터상상은 현실이 된다
이상완 KAIST 뇌인지과학과 부교수·신경과학-인공지능 융합연구센터장
바야흐로 멀티모달 인공지능의 시대다. 글을 쓰면 그림·소리·영상이 되고, 물론 다른 방향의 변환도 가능하다. 오픈AI의 동영상 제작 인공지능 소라(Sora)나 구글 딥마인드의 Veo2를 보면 우리가 프롬프트 창에 두서없이 적어넣은 이야기를 충실히 반영해 그럴듯한 동영상을 만들어 낸다. 빛, 그림자, 움직임과 같은 표현력은 상당한 수준에 이르렀다. 신소재, 화학, 로봇 공학 분야에서는 인공적인 미각, 후각, 촉각을 세운다.
인공지능이 빠르게 영역을 넓혀가니 많은 이들은 가까운 미래에 인공지능으로 대체될 직업을 경쟁적으로 예측한다. 예측이 워낙 다양해서 누군가 한 명은 맞힐 것 같다. 한편 최근 비즈니스 인사이더의 기사를 보면 소라의 성능 한계를 지적하며 당장은 영화산업이 대체되지 않을 거라며 자기 위안한다. 물론 이러한 수요자 중심의 질문들은 사업 방향을 결정하는 데 중요한 이슈이긴 하다. 이제는 질문도 예측도 어느 정도 수렴한 듯하고, 석학들의 답변도 우리가 생각하는 범위에서 크게 벗어나지 않는다.
이제는 인공지능 활용과 한계에 대한 표면적 논의를 넘어 조금 더 근본적인 질문을 해보자. 생성 인공지능은 인간이 만들어 낸 데이터로부터 무엇을 배웠으며, 우리는 인공지능이 학습한 지식을 어떻게 해석해야 할까.
생성 인공지능은 우선 데이터에서 생성에 필요 없는 잡음을 걷어내어 함축된 해석을 하고, 이를 바탕으로 원본 데이터를 생성한다. 디퓨전(Diffusion) 모델과 같은 최신 기술에서는 데이터에 잡음이 섞이는 과정을 거꾸로 학습하여 잡음을 걷어내기도 한다. 이렇게 학습된 인공지능은 원본 데이터 사이의 애매한 영역을 표현하는 '내삽'(Interpolation)을 할 수 있고, 더 나아가 학습영역 바깥의 세상을 예측해 내는 '외삽'(Extrapolation) 능력도 생긴다. 멀티모달 데이터의 내삽은 오감을 배우는 과정과 유사하고, 오감을 외삽하는 능력은 육감에 빗대어 볼 수 있다.
이제 인공지능을 인간의 관점에서 해석해 보자. 인공지능은 위와 같은 학습 과정을 통해 다양한 데이터가 가진 표면적 패턴 속에 숨겨진 원리에 접근한다. 인간이 만들어 낸 데이터를 자유롭게 내삽하는 인공지능은 인류 지식을 관통하는 관점을 보여주는 현미경이 되고, 외삽의 인공지능은 인류 지식의 경계 너머를 내다볼 수 있는 망원경이 된다. 자연이 만들어 낸 데이터를 내삽하는 인공지능은 세상을 지배하는 물리적인 법칙을 보여줄 것이고, 외삽을 통해 새로운 상황에서 직관적이고 물리적인 예측을 할 수 있을 것이다.
정작 인공지능은 아무런 의도도, 거창한 계획도 없는데 우리 입맛에 맞춰 과하게 해석하는 인지적 오류는 아닐까. 하지만 인공지능은 우리의 해석과 무관하게, 그리고 그것의 의도의 유무와 관계없이 오감의 경계를 넘나들며 차근차근 학습해 나가고 있다. '쎄한' 분위기를 알아차리지 못해 억울한 나와 달리 오감의 마스터가 된 생성 인공지능에 "이번 역은 오감, 오감역, 내리실 문은 '육감'입니다."
로버트 프로스트의 시 '가지 않은 길'에서는 기회와 선택에 대한 인간적 고민을 이야기한다. 문과로 진학하여 문학 속 길잡이가 될 것인가, 공대로 진학하여 엔지니어가 될 것인가, 의대로 진학하여 의료인이 될 것인가. 그런데 생성 인공지능에 이러한 고민은 별 의미 없어 보인다.
어떤 인공지능은 이미지를 전공하고, 어떤 인공지능은 소리나 영상을 전공하며 제각기 다른 데이터를 학습하기 시작했지만 배움의 길이 다시 만나는 곳에서 그들이 마주한 깨달음 속에는 전공의 구분이 없다.
인공지능이 의사면허 시험에 합격한 건 이미 오래전 이야기가 됐고 최근 오픈 AI가 공개한 인공지능 o3는 과학, 수학, 코딩 등 다양한 학문분야에서 뛰어난 추론능력을 보여준다. 오감의 경계 없는 인공지능이 추론까지 잘한다면? 그때는 육감과 직관의 영역에 도달했다고 인정해 주자. 그리고 우리의 상상력으로 인공지능의 육감과 직관을 품는 순간, "월터의 상상은 현실이 된다."
이상완 KAIST 뇌인지과학과 부교수·신경과학-인공지능 융합연구센터장
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지