IT >

"초거대 AI시대서 생존법은 AI 특화 전략"

이경무 서울대 석좌교수
사람같은 로봇 완성하려면 시각정보 해석

"초거대 AI시대서 생존법은 AI 특화 전략"
이경무 서울대학교 전기정보공학부 석좌교수가 18일(현지시간) '이미지 캡셔닝' AI의 중요성에 대해 설명하고 있다. LG 제공


【밴쿠버(캐나다)=한국과학기자협회 공동취재단】 이경무 서울대학교 전기정보공학부 석좌교수는 18일(현지시간) 캐나다 밴쿠버 컨벤션센터에서 열리는 '국제 컴퓨터 비전 및 패턴 인식 학회(CVPR) 2023'을 앞두고 LG AI연구원의 캡셔닝 AI를 언급하면서 "AI 특화 분야를 적극적으로 연구하면 초거대 AI 시대 경쟁 환경에서 살아남는 전략이 될 수 있다"고 말했다. 이날 LG가 CVPR에서 주최한 이미지 캡셔닝 AI 워크숍에도 "경쟁이 치열한 CVPR에서 특화 분야 워크숍을 여는 건 분야를 이끌고 있다는 걸 인정받는 것"이라고 평가했다.

이경무 교수는 이미지를 판별하고 설명하는 '이미지 캡셔닝' AI의 중요성에 대해 "로봇이 사람처럼 활동하고 해석하려면 시각 정보를 사람이 인지할 수 있는 언어로 표현할 수 있느냐가 가장 중요한 문제"라고 강조했다.

이 교수에 따르면, 사람이 인지 활동을 할 때 뇌가 외부로부터 받는 정보 중 90%가 시각이다. 이는 시각 정보를 해석하고 인지하지 못하면 진정한 AI를 만들기가 어렵다는 뜻이다.

이 교수는 "시각적 정보를 통해 어떤 물체가 있는지를 포함해 물체의 상태, 물체 간 관계성, 예측 등을 모두 추론할 수 있다"고 말했다.

그는 "LG 초거대AI '엑사원'은 다른 빅테크 기업들이 언어에 중점을 가진 것과 달리 시각 정보에 특화돼 있어 챗GPT 같은 AI가 갖지 못한 장점을 갖고 있다"며 "영상을 설명하는 캡셔닝 기술 등 도전적 문제들을 풀고 있다"고 설명했다.

그는 "챗GPT처럼 엄청난 자원을 투입한 AI도 미국 내에서 구글이나 마이크로소프트 등과 경쟁하기 쉽지 않다는 관측이 있을 정도"라며 "범용 AI 분야는 그만큼 자원을 투입하고도 이점이 불확실한 상황인 만큼 특화 전략을 펼칠 필요가 있다는 것"이라고 설명했다.

이 교수는 이런 전략을 거쳐 장기적으로 시각과 언어 등 여러 정보를 동시에 처리하는 '멀티모달 AI'와 '임베디드 AI 기술' 등으로 연구를 확대할 필요가 있다고 내다봤다.

그는 "다양한 정보로 판단을 내리는 종합적 AI를 개발하려면 우리 뇌처럼 하나의 시스템이 모든걸 다 할 수 있도록 하는 '멀티모달 레이어' 기술이 추후 핵심이 될 것"이라며 "또 로봇과 같은 실제 물리적 시스템에서 AI가 활용돼야 하는 만큼 시스템에서 바로 AI를 활용할 수 있도록 내재해야 실용적인 기술이 될 것"이라고 전망했다.

monarch@fnnews.com 김만기 기자