[파이낸셜뉴스] 교자성체라는 새로운 소재를 이용한 반도체 소자가 개발됐다. 초고속 저전력 인공지능(AI) 반도체 칩 개발에 도움이 될 전망이다. 울산과학기술원(UNIST) 신소재공학과 유정우 교수팀과 물리학과 손창희 교수팀은 산화루테늄 교자성체 기반 자기 터널 접합 소자를 개발하고 이 소자에서 유효한 크기의 터널 자기저항(Tunneling magnetoresistance, TMR)을 측정하는 데 성공했다고 2일 밝혔다. 자기 터널 접합 소자는 MRAM 메모리 반도체를 구성하는 소자다. 현재 MRAM은 강자성체 자기 터널 접합 소자를 기반으로 하는 탓에, 비휘발성이고 전력 소모가 적으며 연산까지 가능한 AI 메모리임에도 불구하고 활용이 제한적이었다. MRAM은 전자의 ‘전하’를 이용하는 일반 메모리와 달리 ‘스핀’이라는 물리적 특성으로 정보를 쓰고 읽는 방식인데, 강자성체라는 물질의 스핀은 반전에 필요한 에너지가 많이 들고 스위칭 속도도 제한적이며, 외부 자기장의 간섭에 민감한 특성이 있기 때문이다. 연구팀은 이 같은 한계를 극복할 수 있는 교자성체 기반 소자를 개발했다. 교자성체는 강자성체 소재처럼 스핀으로 정보를 저장할 수 있으면서도, 외부 자기장에 영향을 덜 받고 초고속 스위칭이 가능한 소재다. 이번 연구에서는 교자성체 특성이 있을 것으로 주목받고 있는 산화루테늄(RuO₂)을 활용했다. 연구팀은 “교자성체 기반 자기 터널 접합 소자에서 스핀 방향에 따라 터널 자기저항 값이 달라지는 현상을 실험적으로 확인한 세계 최초 사례로, 교자성체 소자 기반 AI 메모리 반도체의 실현 가능성을 높인 연구”라며 “터널 자기저항 값의 변화가 더 또렷한 소자를 구현하기 위한 후속 연구를 추진 중”이라고 설명했다. 이번 연구는 2024년 9월 시작된 ‘한계도전 R&D 프로젝트’의 신속한 지원 아래, 소재 합성부터 소자 제작·측정까지 1년이 채 안 되는 기간에 수행된 성과다. ‘한계도전 R&D’는 미국 DARPA 모델을 참고해 기초과학의 최전선을 개척하는 고위험·고파급 주제를 빠르게 실현할 수 있도록 설계된 한국형 프로그램이다. 이번 연구는 UNIST 신소재공학과 노승현 연구원과 물리학과 김계현 연구원이 제1저자로 참여했으며, 이론물리학 분야 최고 권위 저널인 피지컬 리뷰 레터스(Physical Review Letters)에 6월 20일 게재됐다. jiany@fnnews.com 연지안 기자
2025-07-01 14:13:52[파이낸셜뉴스] 뉴로모픽기술 스타트업 나노라티스가 한국투자엑셀러레이터로부터 시드투자를 유치했다. 이번 투자는 한국투자금융지주에서 설립한 한국투자엑셀러레이터의 바른동행7기 모집을 통해 이뤄졌다. 나노라티스는 한국투자엑셀러레이터로부터 투자를 받고, 6개월간 사업 고도화를 위한 다양한 멘토링, 네트워킹 기회를 제공받는다. 투자금액은 비공개다. 투자를 담당한 한국투자엑셀러레이터는 “나노라티스는 인간의 뇌 신경망을 모방한 뉴로모픽칩을 개발하여, 헬스케어 디바이스부터 로보틱스, IoT까지 다양한 분야에서 에너지 효율적인 고성능의 AI구현을 가능하게 할 수 있다. 피지컬 AI시대에 혁신적인 기업으로 빠르게 성장할 것으로 기대한다.”고 밝혔다. 뉴로모픽 기술은 인간의 뇌 구조와 작동 원리를 모방하여 정보를 처리하는 차세대 인공지능 기술로, 기존 디지털 컴퓨팅 방식과는 전혀 다른 접근법을 사용한다. 뉴로모픽 칩은 수많은 뉴런과 시냅스 역할을 하는 소자들이 병렬로 연결되어 있어, 연산을 분산 처리함으로써 낮은 전력으로도 복잡한 계산을 효율적으로 수행할 수 있다. 이러한 특성은 특히 배터리 기반의 엣지 디바이스, 예컨대 헬스케어 웨어러블이나 실시간 데이터 분석이 필요한 휴대형 의료기기 등에 매우 적합하다. 일례로 기존 딥러닝 기반 AI칩은 한 번의 연산을 위해 수십 와트의 전력을 소비하는 반면, 뉴로모픽 칩은 수십 밀리와트 이하로 동작하며, 수십~수백 배 높은 에너지 효율을 보일 수 있다. 또한 뉴로모픽 시스템은 연산과 저장이 한 곳에서 이루어지기 때문에, 기존 컴퓨터에서 발생하는 '메모리 병목 문제'도 자연스럽게 해결할 수 있다. 나노라티스는 이같은 뉴로모픽 기술의 강점을 활용하여, 생체신호 분석과 같은 고속·저전력 처리가 필요한 분야에서 기술 상용화를 추진하고 있다. 대표적으로, 인간의 간질액(체액)을 분석해 실시간으로 혈당 뿐만아니라 젖산, 산소포화도, 염증지표, 심지어 치매관련 바이오마커까지 예측할 수 있는 온디바이스 AI 기반 분석기기 개발을 진행 중이다. 이 기기는 뉴런-시냅스 소자를 통해 신경학적 패턴을 빠르고 효율적으로 분석하며, 외부 서버와의 통신 없이도 현장에서 즉시 판단을 내릴 수 있도록 설계된다. 이처럼 뉴로모픽 기술은 단순한 AI 연산 칩을 넘어, 차세대 헬스케어, 로보틱스, IoT 디바이스의 두뇌 역할을 할 핵심 기술로 부상하고 있다. IB업계 관계자는 "피지컬 AI(Physical AI) 시대의 기반 인프라로써, 뉴로모픽 컴퓨팅은 인간처럼 사고하고 반응하는 기계를 가능하게 하며, 산업 전반의 패러다임 전환을 예고하고 있다"라고 덧붙였다. kakim@fnnews.com 김경아 기자
2025-07-15 08:52:17[파이낸셜뉴스] 한울반도체와 한울소재과학은 국산 고성능 인공지능(AI) 서버 ‘클라이막스(Klimax)-408’과 함께 AI 인프라 시장에 진출한다고 20일 밝혔다. 회사는 ‘소버린(주권형) AI’ 실현과 ‘데이터 주권 확보’를 위한 기술 자립 선언이라는 점에서 상징적 선언이라고 평가했다. 발표는 전일 서울 양재 엘타워에서 열린 기자간담회에서 이뤄졌다. 클라이막스-408은 국내 서버 전문기업 코코링크가 과학기술정보통신부 국책과제를 통해 개발한 고성능 컴퓨팅 서버로, 고속 직렬 인터페이스 버스(PCIe) 5.0 기반 스위칭 기술을 적용해 그래픽처리장치(GPU), 신경망처리장치(NPU) 등 다양한 연산장치를 탑재할 수 있다. 서버 1대당 최대 8장의 GPU 또는 국산 NPU를 장착할 수 있으며 초거대 언어모델(LLM), 자율주행, 산업 AI 등 고도화된 연산 환경에 최적화됐다. 144레인 PCIe 5.0 스위치를 채택해 GPU 중심 연산 구조에서 빠른 처리 속도와 높은 전력 효율, 낮은 시스템 구성 비용을 제공해 국산 AI 인프라의 대표 대안으로 평가된다. 한울반도체는 한울소재과학, 코코링크와 클라이막스-408을 통해 국방, 정보기관, 정부출연연구소, 대학교, 공공기관 등 전략 수요처를 대상으로 AI 인프라 국산화 보급에 나설 계획이다. 이들 수요처는 보안성, 자립성, 예산 효율성을 중시하며 특히 공공기관은 국민의 데이터 주권이 우선시되는 만큼 AI 행정, 빅데이터 분석, 영상처리 등 다양한 분야에서 국산 솔루션 도입 수요가 크다. 한울소재과학 관계자는 “클라이막스 시리즈는 단순 제품 공급을 넘어 공공 디지털 전환과 데이터 주권화를 국산 기술로 구현하는 전환점이 될 것”이라고 말했다. 지방 분산형 AI 인프라 확산 측면에서도 클라이막스 시리즈는 의미 있는 대안으로 평가된다. 국내에서는 강원, 충청, 전북 등 수도권 외 지역에 친환경 기반 데이터센터 유치를 위한 노력이 이어지고 있지만 전력 인프라 부족(22%), 인력 수급 어려움(32%), 수요기업 부족(32%) 등이 주요 애로사항으로 꼽히고 있다. 고성능이면서도 저전력·저비용 구조를 갖춘 클라이막스 시리즈는 지방 데이터센터 유치 전략에 적합하다. 국산화율 제고를 통해 지역 일자리 창출, 기술 내재화, AI 인프라 생태계 확장으로 이어지는 선순환 구조를 기대할 수 있다. AI 산업의 확장에 따라 데이터센터는 단순 IT 인프라를 넘어 국가 전략 자산으로 부상하고 있다. 글로벌 데이터센터 시장은 2022년 382조원에서 2032년 800조원 이상으로 성장할 것으로 전망된다. 미국은 ‘스타게이트 프로젝트’를 통해 4년간 720조원을 투자할 계획이며 일본, 아일랜드 등도 AI 데이터센터에 대한 세제·보조금 혜택을 강화하고 있다. 반면 대한민국의 국산 장비 활용 비율은 서버 11.1%, 스토리지 6.7%, UPS 8%에 불과하다. 메모리와 배터리를 제외하면 대부분의 인프라가 외산에 의존하고 있다. 국내 조립 서버(직생서버)까지 포함하더라도 외산 장비 비중은 약 90%에 달해 데이터센터 생태계의 외산 기술 의존도는 심각한 수준이다. 클라이막스-408은 이러한 취약한 생태 구조를 정면으로 돌파할 수 있는 국산 대안으로 평가된다. 특히 새롭게 확장된 아키텍처로 재설계된 구조를 통해 외산 서버와의 기술적 차별화도 가능하다. 회사는 간담회에서 서버 1대당 최대 20장의 GPU 또는 NPU를 탑재할 수 있는 차세대 모델 ‘클라이막스(Klimax)-720’을 2025년 하반기에 출시할 계획도 함께 공개했다. 해당 모델은 초고속 시뮬레이션, 초거대 AI 모델 학습, 고도화된 국방 AI 등 극한 연산 수요에 대응하는 최상위 국산 서버다. 이동학 코코링크 대표는 “PCIe 5.0 기반 스위칭 기술을 중심으로 다양한 AI 서버 제품군을 지속적으로 확장하고 있다”며 “앞으로도 한울반도체, 한울소재과학과의 전략적 협업을 통해 기술 자립과 글로벌 경쟁력을 동시에 갖춘 AI 인프라 솔루션을 선보일 것”이라고 밝혔다. kakim@fnnews.com 김경아 기자
2025-06-20 08:22:22【파이낸셜뉴스 광주=황태종 기자】광주광역시가 총 254개 기업과 '광주형 인공지능(AI) 비즈니스 업무협약'을 체결하며 '인공지능 대표 도시'의 위상이 더욱 공고히 하고 있다. 특히 최근 들어 고성능 반도체 설계 전문 기업(팹리스)을 잇따라 유치해 주목받고 있다. 30일 광주시에 따르면 지난해 반도체 설계 전문 기업(팹리스)인 ㈜에이직랜드, ㈜에임퓨처, ㈜모아이 등 3곳과 업무협약을 체결한 데 이어 최근 반도체 설계 분야 유망 기업인 ㈜모빌린트, 수퍼게이트㈜ 등 2곳과 추가로 업무협약을 체결했다. ㈜모빌린트는 저전력·고효율 인공지능(AI) 반도체(NPU)를 개발하는 전문 기업으로, 대표 모델로는 에리스(ARIES)와 레귤러스(REGULUS)가 있다. 이 중 레귤러스(REGULUS)는 10 TOPS 수준의 높은 성능을 가진 칩으로, 주로 인공지능(AI) 폐쇄회로텔레비전(CCTV), 중소형 로봇, 드론 등에 사용되며 제한된 전력 조건에서 서버 없이 독립적으로 구현한다. TOPS(Tera Operations Per Second)는 반도체 성능 측정 지표로, 1 TOPS는 1초당 1조번의 연산을 수행한다. 모빌린트는 레귤러스를 'CES 2025'에서 공개하며 인공지능(AI)부문 'CES 혁신상'을 수상했다. 수퍼게이트㈜는 고성능 컴퓨팅 기술을 바탕으로 시스템 반도체를 개발하는 기업이다. 특히 자동차용 반도체 설계 분야에 전문성을 보유하고 있으며 160 TOPS 성능의 완전자율주행 시스템 반도체를 개발하고 있다. 지난해 국내 기업 중 유일하게 한국전자통신연구원(ETRI)으로부터 슈퍼컴퓨터용 반도체 개발에 필요한 기술을 이전 받아 오는 2030년 제조를 목표로 개발 중이다. 슈퍼컴퓨터용 반도체는 대규모 연산을 초고속으로 수행하며, 주로 일기예보·국방·우주 등 첨단 산업에 활용한다. 이번 협약에 따라 두 기업은 법인 또는 지역사무소 설립을 추진하고 인공지능(AI) 반도체 전문 분야 기술 개발과 사업화를 통해 광주 인공지능 반도체 생태계 조성과 지역 신규 일자리 창출에 적극 협력하기로 했다. 지역 기업들과 동반 성장도 기대된다. 특히 광주시는 반도체 설계 기업 5개사와 잇따라 업무협약을 체결함에 따라 국산 인공지능(AI) 반도체 개발에 방점을 찍고 지역 기업의 수요에 맞는 광주형 인공지능 반도체를 만들어 상용화에 박차를 가한다는 방침이다. 국내 인공지능 반도체 시장이 그래픽처리장치(GPU) 회사인 엔비디아에 대한 의존도가 높은 데다 지역 기업들은 높은 비용과 적기 수급 문제 등으로 어려움을 겪고 있는 만큼 오는 2029년까지 1000개 기업 유치를 목표로 반도체 설계 기업을 포함한 인공지능 기업들을 유치해 집적화함으로써 '인공지능 대표 도시 광주'로 나아가겠다는 구상이다. 강기정 광주시장은 "광주시는 국가데이터센터를 비롯한 인공지능 인프라가 집적해 있고 대학과 대학원의 전문 인력 양성 시스템 등 기업 활동에 최적의 여건을 갖추고 있다"면서 "앞으로도 팹리스 기업을 포함한 인공지능 기업들을 유치하고 광주에서 성장을 이어갈 수 있도록 다각적으로 지원해 '인공지능 대표 도시'로 나아갈 것"이라고 말했다. hwangtae@fnnews.com 황태종 기자
2025-01-30 10:24:27[파이낸셜뉴스] 생성형 인공지능(AI)의 대중화로, 앞으로는 모든 개별 기기에서 AI 알고리즘이 작동되는 ‘온디바이스 AI’ 시장이 급속도로 성장할 것이란 전망이 나왔다. 4일 삼일PwC가 발간한 ‘제3의 IT 혁명 디바이스 시대가 온다: 온디바이스 AI’ 보고서에 따르면 AI가 탑재된 전자기기 수요가 폭발적으로 늘어남과 동시에, AI 전용 반도체 및 AI 경량화 기술 경쟁도 본격화할 전망이다. 보고서는 "특히 온디바이스 AI는 작은 규모의 데이터를 기반으로 학습 및 연산하기 때문에 가치 있는 데이터를 뽑아내는 역량이 비즈니스 성과와 직결될 것"이라고 내다봤다. 온디바이스 AI란 스마트폰, 노트북, 자동차 등 기기 자체에서 AI 기능을 수행하는 기술이다. 클라우드 서버를 거치지 않아 서비스 제공 속도가 빠르고, 데이터 보안에 유리하며 막대한 데이터 센터 운영 비용 및 시간이 절감된다는 장점을 갖고 있다. 글로벌 시장조사 기관인 글로벌마켓인사이트(GMI)에 따르면 전 세계 온디바이스 AI 시장 규모는 2023년 50억 달러(약 7조 원)에서 2032년 700억 달러(약 87조 원)로 연평균 25%가량 성장할 전망이다. 보고서는 “온디바이스 AI는 향후 사용자의 일상생활에 스며들어 사용자에 대한 정보를 직접 파악할 수 있게 돼 개별 기기의 사용자 맞춤형 서비스 강화에 기여할 것”이라고 설명했다. 그러면서 온디바이스 AI 시장의 가파른 성장에 따라 AI의 핵심 두뇌에 해당하는 AI 반도체에 주목했다. AI 반도체란 AI 구현에 필요한 대규모 연산을 초고속∙저전력으로 실행하는 비메모리 반도체를 뜻한다. 딥러닝에 적합한 연산을 가속해주는 추론용 AI 반도체인 신경망처리장치(NPU)가 대표적인 예다. 이와 함께 기존보다 더 작은 크기의 고성능∙저전력 메모리 반도체인 디램(DRAM)에 대한 수요도 급증할 것으로 내다봤다. 보고서는 “고부가가치 디램이 온디바이스 AI의 주요 솔루션으로 떠오르면서 ‘공급자 우위’ 추세가 당분간 지속될 전망이며, AI 메모리 반도체는 다양한 영역의 맞춤형 주문이 가능해 향후 비즈니스 또한 수주형으로 변할 것”이라고 예상했다. 정재국 삼일PwC IT산업 리더(파트너)는 “스마트폰과 PC 이외에도 온디바이스 AI는 확장현실(XR) 헤드셋, 로봇, 드론 등 여러 하드웨어 기기에 빠르게 적용될 것"이라며 "AI 기반 고사양 하드웨어 개발을 위한 경쟁이 더욱 치열해질 것”이라고 말했다. 이어 “결국 하드웨어 기기에 이어 소프트웨어, 칩, 서비스까지 수직 통합 기반의 시스템을 구축할 수 있는 기업이 온디바이스 AI 시대의 진정한 강자가 될 것”이라고 덧붙였다. 보고서에 대한 상세한 내용은 삼일PwC 홈페이지에서 확인할 수 있다. khj91@fnnews.com 김현정 기자
2024-09-04 08:50:17[파이낸셜뉴스] SK하이닉스는 지난 21일 서울 중구 대한상공회의소에서 열린 ‘제59회 발명의 날 기념식’에서 김종환 부사장(D램개발 담당)이 철탑산업훈장을, 김웅래 팀장(D램코어디자인)이 국무총리표창을 수상했다고 22일 밝혔다. SK하이닉스 D램 기술 개발을 이끌고 있는 김 부사장은 인공지능(AI) 메모리 개발 공적으로 철탑산업훈장을 수상했다. 김 부사장은 2021년부터 회사의 D램 개발을 총괄하면서 2022년 6월 AI 메모리인 고대역폭메모리(HBM) 4세대 제품 HBM3 양산 성공을 이끌었다. 지난해 8월에는 5세대 제품인 HBM3E를 개발해냈다. 또 메모리에 연산 기능을 더한 차세대 지능형 메모리 '프로세싱 인 메모리(PIM)를 개발하고, 메모리와 다른 장치들 사이에 인터페이스를 하나로 통합해 제품 성능과 효율성을 동시에 높여주는 컴퓨트 익스프레스 링크(CXL) 메모리 개발에도 기여했다. 국무총리표창을 수상한 김 팀장은 D램 10나노급 미세공정에 도입되는 회로 관련 설계 기술을 개발해 제품 성능 향상과 원가 절감을 이뤄낸 공로를 인정받았다. 아울러 모바일용 저전력더블데이터레이트(LPDDR)4와 LPDDR5의 초고속·저전력 동작 기술을 개발하고 핵심 특허를 출원해 국가 지식재산(IP) 확보에 기여한 점을 높이 평가받았다. mkchang@fnnews.com 장민권 기자
2024-05-22 13:02:50국내 연구진이 세계 최초로 클라우드를 거치지 않고 스마트폰이나 노트북만으로도 거대언어모델(LLM)을 처리할 수 있는 뉴로모픽 컴퓨터용 인공지능(AI) 반도체를 개발했다. 이 반도체로 인간의 뇌를 닮은 뉴로모픽 컴퓨팅을 만들어 '온 디바이스', 즉 장치 내에서 0.4초 만에 LLM을 처리하는데 성공했다. 무엇보다 이같은 작업을 진행하는데 엔비디아의 그래픽 처리장치(GPU) 보다 소모전력을 625분의 1 수준으로 줄였고, 칩 크기도 41분의 1에 불과했다. 연구진은 이론적인 논문에 그치지 않고 삼성전자의 28나노 파운드리 공정을 통해 직접 칩을 제작했다. AI 반도체 '상보형-트랜스포머'를 개발한 한국과학기술원(KAIST) AI반도체 대학원 유회준 교수는 6일 과학기술정보통신부 브리핑실에서 "초저전력의 뉴로모픽 액셀러레이터를 가지고 거대 모델인 'GPT-2'를 돌린 것은 세계 최초"라고 말했다. ■GPT-2 실행속도 3~9배 빨라 AI 반도체는 현재 엔비디아가 장악하고 있는 GPU, 다음 단계로 신경망 처리장치(NPU), 지능형 반도체(PIM) 순이며, 최종 종착지가 바로 인간의 뇌를 모사하는 뉴로모픽 컴퓨팅이다. 이번 반도체 개발에 참여한 KAIST 김상엽 박사가 이날 직접 시연을 해 보였다. 인터넷 연결이 안된 노트북에 '상보형-트랜스포머' 칩이 내장된 보드를 연결해 GPT-2로 문장 요약과 번역, 질의응답을 실행했다. 그 결과, 일반 노트북으로 GPT-2를 실행한 것보다 최소 3배에서 최대 9배 빨랐다. 또한 갤럭시S24에 연결해도 GPT-2를 쉽고 빠르게 실행시켰다. 윤두희 과기정통부 정보통신산업정책과장은 "그동안 AI 서비스들은 LLM을 실행시키기 위해 엔비디아의 A100 같은 칩으로 처리해 휴대폰으로는 도저히 불가능했다"며 "이 뉴로모픽 액셀러레이터를 사용하게 되면 현재 아마존의 알랙사, KT의 지니 등 시중에 나와있는 AI 서비스를 클라우드와 연결하지 않고 기계 자체에서 다 처리할 수 있게 될 것"이라고 설명했다. 또한 윤 과장은 "반도체 기업과 학교 간의 협력 강화를 위해서 지난 2022년 6월 과기정통부 PIM 예타사업 지원을 통한 결과물"이라며 "이 사업으로 향후 추가적인 성과도 기대할 수 있을 것"이라고 전망했다. ■하이브리드식 연산처리 이번 연구를 통해 개발한 AI반도체용 하드웨어 유닛은 기존 LLM 반도체 및 뉴로모픽 컴퓨팅 반도체에 비해 4가지의 특징을 지닌다. 심층 인공 신경망(DNN)과 스파이킹 뉴럴 네트워크(SNN)를 상호 보완하는 방식으로 융합한 독특한 신경망 아키텍처를 사용함으로써 정확도를 유지하면서도 연산 에너지 소모량을 최적화했다. 또 DNN과 SNN 모두를 효율적으로 활용할 수 있는 AI반도체용 통합 코어 구조를 개발했다. 특히 SNN 처리에 소모되는 전력을 줄이기 위해 출력 스파이크 추측 유닛까지 개발했다. 이와 함께, LLM의 파라미터를 효과적으로 압축하기 위해 빅-리틀 네트워크 구조와 암시적 가중치 생성기법, 그리고 부호압축까지 총 3가지 기법을 사용했다. 이를 통해 GPT-2 모델의 708M개에 달하는 파라미터를 191M개로 줄였으며, 번역을 위해 사용되는 T5 모델의 402M개에 달하는 파라미터 역시 동일한 방식을 통해 76M개로 줄일 수 있었다. 김상엽 박사는 "이러한 압축을 통해 연구진은 언어 모델의 파라미터를 외부 메모리로부터 불러오는 작업에 소모되는 전력을 약 70% 감소시켰다"고 설명했다. 이어 "상보형-트랜스포머는 전력 소모를 GPU(엔비디아 A100) 대비 625배 만큼 줄이면서도 GPT-2 모델을 활용한 언어 생성에는 0.4초의 고속 동작이 가능하며, T5 모델을 활용한 언어 번역에는 0.2초의 고속 동작이 가능하다"고 덧붙였다. monarch@fnnews.com 김만기 기자
2024-03-06 18:01:28[파이낸셜뉴스] 국내 연구진이 세계 최초로 클라우드를 거치지 않고 스마트폰이나 노트북만으로도 거대언어모델(LLM)을 처리할 수 있는 뉴로모픽 컴퓨터용 인공지능(AI) 반도체를 개발했다. 이 반도체로 인간의 뇌를 닮은 뉴로모픽 컴퓨팅을 만들어 '온 디바이스', 즉 장치 내에서 0.4초 만에 LLM을 처리하는데 성공했다. 무엇보다 이같은 작업을 진행하는데 엔비디아의 그래픽 처리장치(GPU) 보다 소모전력을 625분의 1 수준으로 줄였고, 칩 크기도 41분의 1에 불과했다. 연구진은 이론적인 논문에 그치지 않고 삼성전자의 28나노 파운드리 공정을 통해 직접 칩을 제작했다. AI 반도체 '상보형-트랜스포머'를 개발한 한국과학기술원(KAIST) AI반도체 대학원 유회준 교수는 6일 과학기술정보통신부 브리핑실에서 "초저전력의 뉴로모픽 액셀러레이터를 가지고 거대 모델인 'GPT-2'를 돌린 것은 세계 최초"라고 말했다. GPT-2 실행속도 3~9배 빨라 AI 반도체는 현재 엔비디아가 장악하고 있는 GPU, 다음 단계로 신경망 처리장치(NPU), 지능형 반도체(PIM) 순이며, 최종 종착지가 바로 인간의 뇌를 모사하는 뉴로모픽 컴퓨팅이다. 이번 반도체 개발에 참여한 KAIST 김상엽 박사가 이날 직접 시연을 해 보였다. 인터넷 연결이 안된 노트북에 '상보형-트랜스포머' 칩이 내장된 보드를 연결해 GPT-2로 문장 요약과 번역, 질의응답을 실행했다. 그 결과, 일반 노트북으로 GPT-2를 실행한 것보다 최소 3배에서 최대 9배 빨랐다. 또한 갤럭시S24에 연결해도 GPT-2를 쉽고 빠르게 실행시켰다. 윤두희 과기정통부 정보통신산업정책과장은 "그동안 AI 서비스들은 LLM을 실행시키기 위해 엔비디아의 A100 같은 칩으로 처리해 휴대폰으로는 도저히 불가능했다"며 "이 뉴로모픽 액셀러레이터를 사용하게 되면 현재 아마존의 알랙사, KT의 지니 등 시중에 나와있는 AI 서비스를 클라우드와 연결하지 않고 기계 자체에서 다 처리할 수 있게 될 것"이라고 설명했다. 또한 윤 과장은 "반도체 기업과 학교 간의 협력 강화를 위해서 지난 2022년 6월 과기정통부 PIM 예타사업 지원을 통한 결과물"이라며 "이 사업으로 향후 추가적인 성과도 기대할 수 있을 것"이라고 전망했다. 하이브리드식 연산처리 이번 연구를 통해 개발한 AI반도체용 하드웨어 유닛은 기존 LLM 반도체 및 뉴로모픽 컴퓨팅 반도체에 비해 4가지의 특징을 지닌다. 심층 인공 신경망(DNN)과 스파이킹 뉴럴 네트워크(SNN)를 상호 보완하는 방식으로 융합한 독특한 신경망 아키텍처를 사용함으로써 정확도를 유지하면서도 연산 에너지 소모량을 최적화했다. 또 DNN과 SNN 모두를 효율적으로 활용할 수 있는 AI반도체용 통합 코어 구조를 개발했다. 특히 SNN 처리에 소모되는 전력을 줄이기 위해 출력 스파이크 추측 유닛까지 개발했다. 이와 함께, LLM의 파라미터를 효과적으로 압축하기 위해 빅-리틀 네트워크 구조와 암시적 가중치 생성기법, 그리고 부호압축까지 총 3가지 기법을 사용했다. 이를 통해 GPT-2 모델의 708M개에 달하는 파라미터를 191M개로 줄였으며, 번역을 위해 사용되는 T5 모델의 402M개에 달하는 파라미터 역시 동일한 방식을 통해 76M개로 줄일 수 있었다. 김상엽 박사는 "이러한 압축을 통해 연구진은 언어 모델의 파라미터를 외부 메모리로부터 불러오는 작업에 소모되는 전력을 약 70% 감소시켰다"고 설명했다. 이어 "상보형-트랜스포머는 전력 소모를 GPU(엔비디아 A100) 대비 625배 만큼 줄이면서도 GPT-2 모델을 활용한 언어 생성에는 0.4초의 고속 동작이 가능하며, T5 모델을 활용한 언어 번역에는 0.2초의 고속 동작이 가능하다"고 덧붙였다. monarch@fnnews.com 김만기 기자
2024-03-06 14:12:33[파이낸셜뉴스] 삼성전자가 차세대 먹거리로 AI반도체 기술인 Neuromorphic Artificial Intelligence Chip(뉴로모픽 AI칩)를 향한 움직임을 본격화 하는 모양새다. 이에 벌써부터 증권가에선 관련 수혜주 찾기에 분주하다. 현재 뉴로모픽 관련 테마주로는 삼성전자를 고객사로 둔 네패스아크, 해당 기술을 연구중인 오픈엣지테크놀로지, 자람테크놀로지 등이 꼽힌다. 16일 재계 등에 따르면 삼성전자가 함돈희 하버드대 교수를 SAIT(옛 삼성종합기술원) 부원장에 선임한 것으로 알려졌다. 한국인으로선 하버드대 최연소 교수이기도 한 함 교수는 작년 연말 인사에서 SAIT 원장을 맡은 경계현 디바이스솔루션(DS) 부문장(사장)과 함께 SAIT를 이끌며 미래 성장엔진에 필요한 핵심 요소 기술의 선행 개발을 주도할 것으로 보인다. 함 교수는 앞서 2021년 김기남 당시 삼성전자 부회장, 황성우 삼성SDS 사장 등과 함께 AI반도체 기술 뉴로모픽(Neuromorphic) 주제 논문을 집필했다. 이는 세계적인 학술지 '네이처 일렉트로닉스'에 게재됐다. 2022년에는 공동 교신저자로 참여해 자기저항메모리(MRAM)를 기반으로 한 '인-메모리(In-Memory) 컴퓨팅'을 세계 최초로 구현한 연구 결과가 '네이처'에 게재되기도 했다. 함 교수가 삼성의 싱크탱크 역할을 하는 SAIT의 수장으로 향후 먹거리 발굴에 집중할 것으로 알려지면서 뉴로모픽 반도체도 뜨거운 감자로 떠올랐다. 실제 함 교수는 가장 진화 된 꿈의 AI반도체 '뉴로모픽 칩' 권위자여서 삼성전자가 향후 관련 사업에 관심을 기울 일 것으로 전망되고 있기 때문이다. 통상 AI에는 일반 시스템 반도체보다 대량의 데이터를 동시에 처리하는데 특화된 반도체가 사용되며 크게 세 가지 세대로 분류되는데, 인간의 두뇌를 모방한 신경망을 기반으로 하는 ‘뉴로모픽’이 3단계 AI 반도체로 구분된다. 업계 관계자는 “시스템온칩(SoC)의 궁극적인 방향성은 결국 인간의 뇌를 닮은 뉴로모픽 반도체”라며 “뉴로모픽 컴퓨팅은 기존의 CPU와 메모리가 직렬로 연결된 구조에서 벗어나, 인간의 뇌가 뉴런과 시냅스로 구성된 것과 같은 인공 뉴런으로 구성된 병렬 네트워크로 연산, 메모리, 통신 기능을 융합한 형태”라고 말했다. 현재까지 뉴로모픽 칩은 AI반도체 중에서 가장 진화된 반도체로 불리운다. 실질적인 공시로 뉴로모픽반도체에 대해 밝힌 회사는 네패스아크가 대표적이다. 네패스아크는 시스템반도체 후공정 테스트 기업으로 전력관리반도체(PMIC), 디스플레이 구동칩(DDI), 모바일프로세서(AP) 등의 테스트 사업을 하고 있다. 주요 고객사는 삼성전자다. 공시에 따르면 네패스아크는 'Neuromorphic Artificial Intelligence Chip(뉴로모픽 인공지능칩) 테스트 개발'을 완료했다. 회사측은 "당사가 테스트 개발한 제품은 네패스 퓨처인텔리전스사업부에서 개발한 것으로 칩 자체에서 학습한 판단(인지) 기능을 모두 포함하고 있는 제품"이라고 밝혔다. 해당 제품은 576개의 인공 뉴런을 집적한 AI 반도체로 1개의 뉴런은 메모리와 인공지능 연산을 위한 Logic 영역으로 구성되어 있다. 뉴런의 개수를 쉽게 확장할 수 있는 아키텍쳐를 가지고 있으며, 저전력 소형화가 가능하면서도 사람의 뇌와 같은 고속 병렬 연산 처리가 가능한 칩이다. 제어로직부 등 학습 및 저장·복구 인식기능에 대한 테스트 알고리즘을 구현한 국내 최초의 테스트라 할 수 있으며 '양산 적용'된 상태다. 또한 주목할 점은 세계 최초로 뉴로모픽칩을 개발한 업체가 네패스라는 점이다. 지난 2017년 네패스는 세계 최초로 뉴로모픽 칩 을 개발해 상용화했다. 한편 가시적인 성과로 제품화에 성공한 네패스아크 외에도 해당 기술을 연구개발하고 있는 기업들도 눈에 띈다. 오픈엣지테크놀로지는 중소벤처기업부의 '모바일 AI 구현을 위한 뉴로모픽 반도체(NPU) IP 개발'을 수행했다. 해당 연구는 2018년 4월부터 2020년 3월까지 중소벤처기업부 주관으로 시행됐다. 또한 자람테크놀로지도 2024년 상반기 완료를 목표로 관련 기술을 개발 중이다. 자람테크놀로지는 프로세서 설계 기술과, 분산처리기술, 저전력 반도체 설계 기술로 경쟁력 확보가 가능한 엣지향 인공지능 프로세서 개발 중이다. 해당 프로세서는 'SNN방식의 뉴로모픽 프로세서를 기반으로 성능향상을 위해 CNN을 추가한 하이브리드형'라고 알려졌다. kakim@fnnews.com 김경아 기자
2024-02-16 08:43:52【파이낸셜뉴스 광주=황태종 기자】세계적 수준의 국가인공지능(AI)데이터센터가 오는 15일부터 본격 가동된다. 광주광역시는 첨단3지구 인공지능중심산업융합집적단지 내 핵심시설인 국가인공지능데이터센터 서비스를 오는 15일 개시한다고 밝혔다. 국가인공지능데이터센터는 초거대 인공지능(AI) 모델을 개발할 수 있는 고성능 컴퓨팅 자원 등의 서비스를 지원한다. 현재 인공지능(AI) 모델은 점점 더 복잡해지고 개발에 필요한 데이터량이 커지고 있는 상황에서 메모리 용량과 데이터 처리 속도를 높인 초고성능 컴퓨팅 자원의 필요성이 커지고 있다. 광주시는 엔비디아의 최신 성능 가속기 'H100' 등 고성능 컴퓨팅 자원을 통해 짧은 시간 내 방대한 데이터 학습, 분석 및 활용을 지원할 수 있어 인공지능(AI) 연구 개발에 최적화된 인프라를 제공한다. 이로 인해 창업 초기기업(스타트업)들도 복잡한 인공지능(AI) 서비스 개발·연구가 가능해져 인공지능(AI) 산업융합 생태계가 활성화될 것으로 기대된다. 국가인공지능데이터센터는 20페타플롭스(PF) 규모의 고성능 컴퓨팅(HPC)과 68.5페타플롭스(PF) 규모의 GPU 클라우드 혼용 방식으로 구축돼 총 88.5페타플롭스(PF) 연산 자원과 107페타바이트(PB) 저장 공간을 갖춘 세계적 수준의 규모다. 1페타플롭스(PF)는 초당 1000조번의 수학 연산처리를 뜻하며, 1페타바이트(PB)는 6기가바이트(GB) 영화 17만4000편의 영화를 보관할 수 있는 용량을 말한다. 데이터센터는 연면적 3144㎡의 2층 구조로, 인공지능 개발을 위한 260랙 규모의 전산실에 6메가와트(MW)의 전력이 소요된다. 사용자가 통신 회선 사업자를 자유롭게 선택해 사용할 수 있는 망중립 데이터센터이며, 수도권과 동일한 네트워크 품질 신뢰성과 접근성을 제공한다. 앞서 광주시는 지난 10월 23일 전체 구축량의 50%인 연산 자원 44.3페타플롭스(PF), 저장 공간 53.5페타플롭스(PF) 규모의 자원 구축과 성능 테스트를 마쳤다. 12월에 추가로 가속기 24페타플롭스(PF)와 내년 1분기에 20페타플롭스(PF) 규모의 고성능 컴퓨팅(HPC)이 구축될 예정이다. 광주시는 이를 통해 1000여 개의 인공지능(AI) 기업을 지원할 수 있을 것으로 보고 있다. 기업은 인공지능(AI) 개발하는데 반드시 필요한 고비용의 연산 자원과 저장 공간 및 개발 환경을 무료로 제공받고 개발 시간도 단축된다. 이에 따라 광주에는 국내외 인공지능(AI) 기업이 모여 협업하고, 기술개발과 활용을 촉진하는 인공지능 산업생태계가 구축될 전망이다. 광주시는 자원 이용 기관(업) 선발을 위해 지난 10월 공모를 진행해 10월 27일 263개 기업에 가속기 21페타플롭스(PF)와 스토리지 8페타바이트(PB) 자원을 할당했다. 아울러 정부가 추진하는 초고속·저전력 국산 인공지능(AI)반도체 개발과 데이터센터 적용을 통해 국내 클라우드 경쟁력을 강화하기 위한 'K-클라우드 프로젝트' 일환으로 데이터센터 내에 11페타플롭스(PF) 규모의 인공지능(AI)반도체(NPU, Neural Processing Unit, 신경망처리장치)팜 실증·구축도 병행한다. 인공지능(AI)반도체(NPU)는 인공신경망 알고리즘을 효율적으로 계산할 수 있는 반도체로, AI 프로그램을 개발하기 위한 학습·추론 등 연산을 저전력으로 고속 처리할 수 있는 반도체를 말한다. 광주시는 1단계 인프라의 고도화와 도시 규모의 실증을 목표로 인공지능(AI) 2단계 사업을 순차적으로 진행하기 위해 예비타당성 용역을 준비 중이다. 김용승 광주시 인공지능산업실장은 "광주시는 데이터센터를 비롯한 인공지능(AI)집적단지 인프라와 도시 규모의 실증 환경을 조성해 기업에 제공하고, 기업은 실증 환경을 활용해 국민 생활에 실질적 도움이 되는 인공지능(AI) 서비스를 만들어갈 것"이라며 "이를 통해 대한민국의 인공지능(AI) 대표도시 광주가 명실상부한 한국의 실리콘밸리로 성장할 것으로 기대한다"라고 말했다. 한편 광주시는 국가인공지능(AI)데이터센터 개관행사를 관계 기관 협의를 거쳐 향후 개최할 예정이다. hwangtae@fnnews.com 황태종 기자
2023-11-14 17:33:14