의학·과학 >

 'AI 학습에 최적화' 21배 빠른 지능형 반도체 시스템 개발

KAIST 유민수 전기전자공학부 교수팀 
메모리·연산기능 결합한 반도체 기술 이용

 'AI 학습에 최적화' 21배 빠른 지능형 반도체 시스템 개발
한국과학기술원 전기및전자공학부 유민수 교수 연구팀이 세계 최초로 '프로세싱-인-메모리(PIM)' 기술 기반의 AI 가속기 반도체 시스템 개발했다. 왼쪽부터 유민수 교수, 권영은 박사과정, 이윤재 석사과정. 한국과학기술원 제공
[파이낸셜뉴스] 국내 연구진이 메모리 안에 연산기능을 결합한 반도체 기술을 이용해 인공지능(AI) 추천시스템 학습 알고리즘 가속에 최적화된 지능형 반도체 시스템을 개발했다. 이 시스템은 기존 AI 가속 시스템 대비 최대 21배까지 빠르다고 연구진이 설명했다.

한국과학기술원(KAIST)은 전기및전자공학부 유민수 교수 연구팀이 세계 최초로 '프로세싱-인-메모리(PIM)' 기술 기반의 AI 가속기 반도체 시스템 개발에 성공했다고 16일 밝혔다.

AI 기술을 기반으로 고안된 추천시스템 알고리즘은 구글, 페이스북, 유튜브, 아마존 등 빅테크 기업들이 콘텐츠 추천 및 개인 맞춤형 광고를 제작하는데 기반이 되는 핵심 AI 기술이다.

페이스북이 최근 공개한 자료에 따르면 페이스북 데이터센터에서 처리되는 AI 연산의 70%가 추천 알고리즘을 처리하는 데에 사용되며, AI 알고리즘 학습을 위한 컴퓨팅 자원의 50%를 추천 알고리즘을 학습하는 데 사용하고 있다.

연구진은 이 시스템이 AI 추천시스템 알고리즘의 학습 과정을 엔비디아(NVIDIA)의 그래픽카드(GPU)를 사용하는 기존 AI 가속 시스템 대비 최대 21배까지 빠르다고 설명했다.

추천 인공지능의 경우 많은 수의 임베딩을 학습하는 과정이 주된 병목을 일으킨다. 연구진은 이번 연구에서 임베딩의 학습과정에서 진행되는 모든 연산을 단일 연산으로 변환 할 수 있는 알고리즘을 개발했다. 해당 알고리즘은 기존 방식에 비해 메모리 대역폭 사용량을 크게 줄이고 연산을 단일화했다. 이는 효율적인 하드웨어 가속기 구현을 가능케 한다.

이렇게 만든 임베딩 가속장치는 해당 알고리즘을 기반으로 하드웨어 복잡도가 크게 감소한다. 연구진은 기존 상용화된 메모리 장치에 추가하는 방식으로 임베딩의 저장 및 연산을 동시에 효과적으로 수행할 수 있는 가속 장치를 개발했다.

 'AI 학습에 최적화' 21배 빠른 지능형 반도체 시스템 개발
기존 딥러닝 학습 가속기 시스템에 지능형메모리반도체(PIM) 기술을 적용한 가속기 시스템. 기존 심층신경망네트워크(DNN) 부분과 임베딩 부분을 분리, 각각 그래픽카드(GPU)와 메모리 중심의 지능형메모리반도체(PIM)를 이용해 가속하는 시스템으로 구성돼 있다. 한국과학기술원 제공
전문가들은 이번 연구 성과가 향후 막대한 수요와 급성장이 예상되는 세계 AI 반도체 시장에서 메모리-중심으로 설계된 PIM 기술의 상용화 및 성공 가능성을 시사한다는 점에서 높게 평가하고 있다.

한편, 이번 연구 결과는 세계 최초의 추천시스템 학습용 가속기 시스템 개발 성과라는 학술 가치를 인정받아 내년 2월 컴퓨터 시스템 구조 분야 최우수 국제 학술대회인 IEEE HPCA 국제 심포지엄에서 발표된다. 삼성미래기술육성재단이 지원한 이번 연구에 KAIST 전기및전자공학부 권영은 박사과정이 제1 저자, 이윤재 석사과정이 제2 저자로 참여했다.

유 교수는 관련 분야에서 그동안의 탁월한 연구 성과를 인정받아 올해 아시아에서 유일하게 '페이스북 패컬티 리서치 어워드'를 수상했다.

monarch@fnnews.com 김만기 기자