[파이낸셜뉴스]인공지능(AI) 스타트업 업스테이지는 차세대 광학문자인식(OCR) 모델 '도큐먼트 파스'를 공개했다고 17일 밝혔다. 도큐먼트 파스는 여러 열의 레이아웃이나 테이블 등을 포함한 복잡한 형태의 문서까지 각 구조와 텍스트 정보를 정확히 분석해 인식할 수 있다. 어떤 형식의 문서도 HTML과 같은 구조화된 텍스트 형식으로 전환해 기업이나 기관에서 실제 거대언어모델(LLM) 활용 시 바로 적용할 수 있다. 문서 구조 분석 벤치마크 프로그램인 DP-벤치에 따르면 도큐먼트 파스는 레이아웃 및 테이블 구조, 콘텐츠 분석 등 정확성을 측정하는 모든 지표에서 아마존웹서비스(AWS)와 마이크로소프트(MS)를 포함한 빅테크 5개사의 관련 서비스와 비교해, 5% 이상 높은 점수를 받았다. 속도면에서도 1분에 100장을 처리해 같은 기준을 적용한 AWS 텍스트랙트와는 10배, 메타의 라마파스 보다는 5배 가량 빨랐다. 도큐먼트 파스는 DOCX, PDF, PPTX, PNG 등 업무에 사용하는 9종의 문서 처리뿐만 아니라 수식 인식 및 이미지 추출과 같은 새로운 기능을 추가했다. 업스테이지 김성훈 대표는 “도큐먼트 파스는 각 기업이 가진 기존 문서를 가장 정확하게 자산화시켜 LLM을 실제 업무에 즉각 효율적으로 적용할 수 있도록 만드는 최적의 도구”라며 “다양한 분야에서 업무 혁신을 도울 것”이라고 말했다. yjjoe@fnnews.com 조윤주 기자
2024-10-17 10:01:26[파이낸셜뉴스] 업스테이지가 개발한 자체 사전학습 거대언어모델(LLM) ‘솔라’가 더욱 강력해져서 돌아왔다. 업스테이지가 올 11월 출시 예정인 자사의 차세대 LLM ‘솔라 프로’의 초기 테스트용 모델인 ‘솔라 프로 프리뷰’ 버전을 오픈소스 및 무료 API를 통해 전면 공개한다고 11일 밝혔다. 솔라 프로는 솔라 LLM 시리즈의 상위 모델로, 11월 공식 출시를 앞두고 있다. 업스테이지는 현재 개발 중인 모델을 미리 테스트해 볼 수 있는 프리뷰 버전을 오픈소스로 공개하는 한편, API 호출 비용까지 무상 지원할 예정이다. 프리뷰 버전은 영어만 지원하며, 입력 토큰 수도 4096자로 제공한다. 솔라 프로는 220억(22B) 매개변수를 갖춰 기존 ‘솔라 미니’(107억) 대비 두 배 이상 커지고 성능도 대폭 향상됐지만, DUS(깊이 확장 스케일) 기술 등 자체 LLM 모델링 방법론을 더욱 고도화한 결과 여전히 단 1개의 GPU에서 구동이 가능한 수준으로 경량화에 성공했다. 최근 GPU 가격 급등과 수급난으로 골머리를 앓는 기업용 AI 시장의 판도를 크게 바꿀 것으로 기대를 모은다. 솔라 프로는 인문학 뿐만 아니라 과학·기술·공학·수학(STEM) 종합 지식을 평가하는 ‘MMLU Pro’, 지시 이행 능력을 평가하는 ‘IFEval’ 등 최신 LLM 벤치마크(성능 평가) 지표에서 솔라 미니보다 평균 51% 이상 대폭 향상됐다. 최신 지표인 MMLU Pro는 LLM 답변의 정확도를 사지선다로 평가하던 기존 방식에서 선택지를 10개까지 늘려 정답률을 낮추고, 학부생 수준 이상의 추론을 요구해 고난도로 정평이 높다. 특히 이는 마이크로소프트의 ‘파이(Phi)-3 미디엄(Medium)’, 메타 ‘라마(Llama) 3.1 8B’, 미스트랄AI-엔비디아 ‘네모(NeMo) 12B’, 구글 ‘젬마(Gemma) 2 27B’ 등 유사 사이즈의 빅테크 모델 성능을 모두 뛰어넘은 수치다. 매개변수가 3배 이상 큰 ‘라마 3.1 70B’ 등 다중 GPU를 요구하는 모델과 유사한 수준이다. 업스테이지는 자체 기술력으로 소형언어모델(sLLM) 영역에서 또 한 번 독보적인 격차를 만든 것이라고 강조했다. 업스테이지 김성훈 대표는 “자체 기술로 개발한 세계 최고 수준의 LLM 솔라를 통해 글로벌 AI 시장에 도전장을 내민 업스테이지가 더욱 강력한 차기 모델을 야심 차게 준비하고 있다”며 “최소의 인프라 비용으로 업계 최강의 성능을 자랑하는 솔라 프로를 프리뷰 버전을 통해 많이 테스트해보기를 바란다”고 말했다. yjjoe@fnnews.com 조윤주 기자
2024-09-11 10:11:59[파이낸셜뉴스] 업스테이지가 카카오헬스케어와 손잡고 생성형 인공지능(AI) 기반 디지털 헬스케어 사업에 본격적으로 뛰어든다. 업스테이지는 카카오헬스케어와 ‘거대언어모델(LLM)을 활용한 디지털헬스 서비스 개발 업무협약(MOU)’을 체결했다고 4일 밝혔다. 협약식은 지난 3일 경기 판교에 위치한 카카오헬스케어 사옥에서 업스테이지 이활석 최고기술책임자(CTO), 신수용 카카오헬스케어 연구소장 등 양사 주요 관계자들이 참석한 가운데 진행됐다. 양사는 컨소시엄을 구성해 정보통신산업진흥원(NIPA) 주관 ‘소아청소년을 위한 초거대 AI 보건의료 서비스 개발 사업’을 진행한다. 전문 의료인력 부족, 응급실 과밀화 등 소아청소년 의료체계 문제 해결을 위해 초거대 AI를 활용한 △대화형 소아 건강상담 서비스 △맞춤형 질병예측 서비스 △증례추천 서비스 △처방보조 서비스 등을 개발할 계획이다. 이를 위해 업스테이지는 자사가 개발한 사전학습 LLM ‘솔라’를 기반으로 의료진용 특화 모델 ‘솔라 메디컬(가칭)’ 개발을 맡는다. 환자별 증례 추천 모델, 약물 처방 보조 등 다양한 업무를 AI로 자동화함으로써 의료진 업무 부담을 크게 경감할 것으로 기대된다. 금융, 유통, 법률 등 다양한 산업별 LLM 구축 사례를 보유한 업스테이지는 이번 사업으로 의료 및 헬스케어 AI 시장에도 본격 진출을 선언했다. 업스테이지에 따르면 환자의 건강에 직결되는 의료 서비스 특성상 LLM 답변의 높은 정확도가 필수적인데, 미국 파인튜닝 전문기업 프레디베이스 조사 결과 오픈AI의 GPT-4, 메타의 라마 3 등 빅테크 모델을 제친 솔라를 파인튜닝하면 경쟁력을 확보할 수 있다는 판단이다. 이활석 업스테이지 CTO는 “디지털 헬스케어를 선도하는 카카오헬스케어와 손잡고 의료 및 헬스케어 AI 시장에 첫 레퍼런스를 확보하게 돼 뜻깊다”며 “앞으로 업스테이지는 세계 최고 수준의 자체 언어모델 솔라를 기반으로 일선 의료진들의 업무를 지원할 수 있는 전문 모델을 개발할 것”이라고 전했다. soup@fnnews.com 임수빈 기자
2024-09-04 09:23:59업스테이지가 한국지능정보사회진흥원(NIA)와 공동 운영하는 'Open Ko-LLM 리더보드'가 새로운 벤치마크를 적용한 시즌 2로 전면 개편된다고 12일 밝혔다. 'Open Ko-LLM 리더보드'는 2023년 9월 민관협력을 통해 개설된 국내 최대 개방형 한국어 거대언어모델(LLM) 평가 체계로, 산·학·연 각계 분야에서 7월 말 기준 1700개가 넘는 LLM 모델이 제출되어 있다. 최근 LLM 기술이 빠르게 발전함에 따라 1년 전에 만들어진 리더보드 벤치마크의 개선 필요성이 커지면서 업스테이지와 NIA는 기존 벤치마크를 전면 폐지하고 새로운 성능 평가 지표를 적용한 Open Ko-LLM 리더보드 시즌 2 운영을 시작한다. 새롭게 추가된 벤치마크는 △Ko-GPQA(대학원 수준 추론) △Ko-WinoGrande(상식 추론) △Ko-GSM8K(초등 수학) △Ko-EQ-Bench(감성) △Ko-IFEval(지시 이행) △KorNAT-Knowledge(한국어 신뢰성) △KorNAT-Social-Value(사회적 가치) △Ko-Harmlessness(무해성) △Ko-Helpfulness(실용성) 등 총 9개다. 기존에는 LLM의 근본적인 언어능력 평가에 초점을 맞췄다면, 새 시즌에서는 더욱 고도화된 지능과 문제해결 능력 등 실용적이고 현실적인 부분에 집중한다. 이를 위한 지표를 촘촘하게 구성해 고성능 모델의 옥석을 가려낼 수 있을 것이라고 업스테이지는 기대하고 있다. 이에 따라 기존 제출됐던 모든 모델을 비롯, 향후 제출되는 모든 LLM은 신규 벤치마크를 통해 평가될 예정이다. 또 인공지능(AI) 데이터 전문 기업 플리토, 셀렉트스타 및 KAIST AI 대학원이 새롭게 참여해 전문화된 벤치마크 데이터셋을 제공할 예정이다. 조윤주 기자
2024-08-12 18:08:02[파이낸셜뉴스] 업스테이지가 한국지능정보사회진흥원(NIA)와 공동 운영하는 ‘Open Ko-LLM 리더보드’가 새로운 벤치마크를 적용한 시즌 2로 전면 개편된다고 12일 밝혔다. ‘Open Ko-LLM 리더보드’는 2023년 9월 민관협력을 통해 개설된 국내 최대 개방형 한국어 거대언어모델(LLM) 평가 체계로, 산·학·연 각계 분야에서 7월 말 기준 1700개가 넘는 LLM 모델이 제출되어 있다. 최근 LLM 기술이 빠르게 발전함에 따라 1년 전에 만들어진 리더보드 벤치마크의 개선 필요성이 커지면서 업스테이지와 NIA는 기존 벤치마크를 전면 폐지하고 새로운 성능 평가 지표를 적용한 Open Ko-LLM 리더보드 시즌 2 운영을 시작한다. 새롭게 추가된 벤치마크는 △Ko-GPQA(대학원 수준 추론) △Ko-WinoGrande(상식 추론) △Ko-GSM8K(초등 수학) △Ko-EQ-Bench(감성) △Ko-IFEval(지시 이행) △KorNAT-Knowledge(한국어 신뢰성) △KorNAT-Social-Value(사회적 가치) △Ko-Harmlessness(무해성) △Ko-Helpfulness(실용성) 등 총 9개다. 기존에는 LLM의 근본적인 언어능력 평가에 초점을 맞췄다면, 새 시즌에서는 더욱 고도화된 지능과 문제해결 능력 등 실용적이고 현실적인 부분에 집중한다. 이를 위한 지표를 촘촘하게 구성해 고성능 모델의 옥석을 가려낼 수 있을 것이라고 업스테이지는 기대하고 있다. 이에 따라 기존 제출됐던 모든 모델을 비롯, 향후 제출되는 모든 LLM은 신규 벤치마크를 통해 평가될 예정이다. 또 인공지능(AI) 데이터 전문 기업 플리토, 셀렉트스타 및 KAIST AI 대학원이 새롭게 참여해 전문화된 벤치마크 데이터셋을 제공할 예정이다. 업스테이지 김성훈 대표는 “새롭게 개편된 리더보드를 통해 한국어 LLM 성능 평가의 기준점을 한 단계 더 높일 것으로 기대한다”며 “앞으로 업스테이지는 글로벌 표준을 뛰어넘는 국내 AI 생태계 강화에 앞장설 것”이라고 말했다. NIA 황종성 원장은 “리더보드는 민관 협업을 통해 한국어 LLM 생태계 조성에 크게 기여해 오고 있으며 시즌2 개편을 통해 한국어 LLM 기술이 세계적 수준에 한발 더 올라설 수 있는 계기가 되기를 기대한다”고 말했다. yjjoe@fnnews.com 조윤주 기자
2024-08-12 08:24:17[파이낸셜뉴스] 인공지능(AI) 기술 기업 업스테이지가 글로벌 온라인 교육 플랫폼 ‘딥러닝AI(DeepLearning.AI)’를 통해 거대언어모델(LLM) 개발 강좌를 무료로 선보인다고 18일 밝혔다. 딥러닝AI는 세계 4대 AI 석학으로 불리는 딥러닝의 선구자 앤드류 응 미국 스탠퍼드대 교수가 만든 교육 플랫폼이다. 앤드류 응 교수의 특화 과정부터 오픈AI, 구글, 메타, 마이크로소프트(MS) 등 빅테크 기업들이 다양한 AI 수업을 운영 중으로, 국내 기업 중에서는 업스테이지가 최초로 참여한다. 업스테이지는 자체 LLM ‘솔라’를 개발한 노하우를 바탕으로 앤드류 응 교수와 함께 기획한 LLM 사전학습 강의를 선보인다. 사전학습이란 방대한 텍스트 데이터를 기반으로 AI 모델에게 언어적 능력을 학습시키는 과정으로, 문장 생성과 문맥 추론 등 고도의 자연어 처리 능력을 갖춘 LLM 개발의 핵심적인 뼈대를 이룬다. 김성훈 업스테이지 대표와 박은정 최고과학책임자(CSO)가 직접 나서 이론적 기초부터 데이터셋 준비, 모델 훈련 및 벤치마크 테스트 기반의 성능 평가까지 LLM 사전학습의 전 과정을 짚어준다. 강의는 영어로 진행되며, 기초적인 코딩 및 머신러닝 지식만 있으면 누구나 무료로 수강할 수 있다. 특히 솔라의 핵심 기술인 '깊이 확장 스케일(DUS)’ 방법론을 중심으로 매개변수를 경량화해 학습 비용을 절감하는 방법과, 오픈소스로 공개된 사전학습 모델을 기반으로 손쉽게 추가 데이터를 학습시키는 방법 등 전수할 예정이다. 김성훈 업스테이지 대표는 “딥러닝 연구의 세계적 권위자 앤드류 응 교수와 함께 업스테이지만의 LLM 사전학습 노하우를 강의하게 돼 기쁘다”라며 “앞으로 업스테이지는 ‘AI로 세상을 이롭게 한다’는 철학을 바탕으로 전 세계 더욱 많은 사람들이 최신 AI 지식을 습득할 수 있도록 앞장설 것”이라고 전했다. soup@fnnews.com 임수빈 기자
2024-07-18 08:24:34[파이낸셜뉴스] 업스테이지가 프렌들리 AI와 손잡고 자사의 거대언어모델(LLM) ‘솔라' 기반의 번역 모델 인프라 구축 계약을 체결했다고 10일 밝혔다. 업스테이지는 솔라 LLM을 파인튜닝(미세조정)한 한국어-영어 번역 특화 모델을 API(응용프로그램 인터페이스) 형태로 공개했다. 단순 문장 번역을 넘어 전후 문맥을 종합해 의미를 추론하고, 대화의 맥락과 흐름까지 파악하는 딥러닝 번역이 특징이다. 기계번역 평가의 바로미터로 꼽히는 메타의 ‘플로레스’ 벤치마크 평가에서 오픈AI의 GPT-4, 딥엘(DeepL) 등을 뛰어넘을 정도로 정확도가 높은 것으로 평가된다. 업스테이지는 일일 최대 10만여 건에 달하는 번역 트래픽을 효율적으로 처리하기 위해 프렌들리AI의 ‘프렌들리 전용 엔드포인트’를 도입했다. 트래픽 부하에 따라 GPU 할당량을 동적으로 조정하는 ‘자동 스케일링’ 기능을 통해 서비스 운영을 자동화하고 GPU 비용을 크게 절감했다. 업스테이지 김성훈 대표는 “생성형AI 인프라 수행 리더 기업 프렌들리AI와 협력해 솔라 번역 모델의 서비스 비용을 효율화하게 되어 기쁘다”라며 “이제 더 많은 사람들이 세계 최고 수준의 번역 모델을 더욱 빠르고 손쉽게 사용할 수 있을 것으로 기대한다"고 말했다. yjjoe@fnnews.com 조윤주 기자
2024-07-10 13:04:00[파이낸셜뉴스] 업스테이지가 아마존웹서비스(AWS)와 전략적 협력 계약을 체결했다고 27일 밝혔다. 이를 통해 전 세계에서 가장 안전한 첨단 클라우드 기술과 서비스를 활용해 고객이 새로운 생성형 AI 기능을 구축할 수 있도록 AWS와의 파트너십을 확대하고, AWS 기반 소프트웨어의 공동 판매 및 영업을 지원하는 ‘AWS ISV 엑셀러레이트 프로그램’을 통해 AWS와 국내외 AI 시장 공동 개척할 예정이다. 업스테이지는 앞서 AI 모델 개발·배포 서비스 '아마존 세이지메이커'를 활용해 자체 거대언어모델(LLM) ‘솔라’를 개발하는 등 AWS와 협력을 지속해오고 있다. 또 지난 3월에는 파운데이션 모델을 제공하는 AWS의 머신러닝 허브 ‘아마존 세이지메이커 점프스타트’와‘AWS 마켓플레이스’를 통해 솔라의 경량화 모델인 ‘솔라 미니’를 출시, 전 세계 AWS 이용자를 대상으로 자사의 LLM 공급망을 확대했다. 업스테이지는 이번 SCA를 통해 AWS와 협력을 더욱 강화하고 AWS ISV 엑셀러레이트 프로그램을 통해 전 세계 AWS 고객 및 파트너 네트워크를 활용, 솔라의 글로벌 영업기회를 발굴하고 사업화 연계를 함께 추진할 계획이다. 이에 AWS 클라우드를 이용하는 전 세계 다양한 기업 및 공공부문을 대상으로 맞춤형 LLM 도입 수요를 발굴하는 한편, 한국어, 영어 및 일본어 등 다국어를 지원하는 솔라를 더욱 고도화해 글로벌 매출 확대에 나설 예정이다. AWS코리아 윤정원 공공부문 대표는 "업스테이지와 함께 생성형 AI 서비스를 전 세계로 확대하게 되어 기쁘다”며 “다양한 산업군의 기업들이 AWS 클라우드 기반으로 제공되는 업스테이지 AI 솔루션을 활용해 새로운 비즈니스 모델을 창출할 수 있을 것이다. 이번 양사간 협력이 최신 기술에 대한 접근성을 높이고 기업의 AI 도입을 가속화할 것으로 기대한다”고 말했다. 업스테이지 김성훈 대표는 "글로벌 클라우드 시장을 선도하는 AWS와 전략적 협력을 통해 전 세계 기업들이 더 쉽고 빠르게 최신 생성형 AI 솔루션을 도입할 수 있게 될 것”이라며 “업스테이지는 글로벌 AWS 클라우드를 기반으로 더 많은 기업들이 AI의 혜택을 누릴 수 있도록 지원하겠다”고 말했다. 한편, 업스테이지는 AWS 파트너사로서 지난 26일(현지시간)부터 이틀간 미국 워싱턴DC에서 열리는 공공부문 연례행사 ‘AWS 서밋 워싱턴DC’에 참여한다. 업스테이지는 주요 AWS 임원뿐 아니라 다양한 공공기관 관계자들과 만나 협력을 구체화하고 잠재 고객 발굴에 나설 예정이다. yjjoe@fnnews.com 조윤주 기자
2024-06-27 08:05:44[파이낸셜뉴스] 업스테이지는 신한투자증권과 금융투자업 특화 생성형 AI 플랫폼 구축 계약을 체결했다고 13일 밝혔다. 최근 금융권을 중심으로 생성형 AI 도입 시계가 빨라지고 있다. 특히 보안과 정확성이 생명인 금융투자업계를 중심으로 기업 내부 데이터만 학습해 정보 유출을 차단하고, 왜곡된 정보를 생성하는 ‘환각현상’을 최소화하는 ‘프라이빗 LLM’이 핵심 기반으로 떠오르고 있다. 이에 따라 양측은 각각의 전문성을 바탕으로 금융투자업 특성에 맞는 프라이빗 LLM 구축에 나선다. 업스테이지는 자사의 솔라 LLM을 기반으로 금융 전문 데이터를 학습시켜, 반복적인 사내 업무 자동화 뿐만 아니라 다양한 업무로 확장 가능한 특화 모델을 개발할 예정이다. 구체적으로는 각종 보고서 생성, 정보 요약, 번역 등 솔라 LLM의 다양한 기능을 금융투자업 맞춤형으로 고도화하는 한편, 문서 처리 및 정보 검색이 가능한 사내 지식 데이터베이스 시스템을 구축할 계획이다. 업스테이지는 또 자연어 데이터를 기계가 이해할 수 있도록 변환하는 자체 ‘임베딩’ 기술을 기반으로, AI 전문 기업 스켈터랩스와 손잡고 검색을 통해 LLM 답변의 정확도를 끌어올리는 ‘RAG(검색증강생성)’ 등 다양한 기술을 투입해 모델 성능을 끌어올릴 방침이다. 업스테이지 김성훈 대표는 “앞으로 업스테이지는 금융, 보험 등 높은 보안과 신뢰가 필수적인 산업 분야에서 기업 맞춤형으로 사용할 수 있는 특화 모델을 개발, 전방위적 생성형 AI 혁신을 지원해 나갈 것”이라고 말했다. yjjoe@fnnews.com 조윤주 기자
2024-06-13 11:17:13한국지능정보사회진흥원(NIA)은 업스테이지와 공동 운영하는 ‘오픈(Open) Ko-LLM 리더보드’에 평가 지표를 추가하고 업그레이드해 운영할 예정이라고 11일 밝혔다. ‘오픈 Ko-LLM 리더보드’는 지난해 9월 민관 협업을 통해 개설돼 학계 및 업계 다양한 참여자들로부터 큰 관심을 받고 있으며 지난 5월 말까지 참여한 초거대언어모델(LLM) 모델 수가 1500개를 넘어섰고 최고 점수는 70.7점을 기록했다. 이는 세계적으로 인정받는 허깅페이스의 LLM 리더보드(최고점 81.2점)에 근접한 수치로, 한국어 LLM이 발전하고 있음을 입증하는 결과라고 NIA는 설명했다. NIA와 업스테이지는 Open Ko-LLM 리더보드의 지속적인 발전과 개선을 위해 우선 추론 관련 지표를 추가해 운영할 계획이다. 이번에 추가하는 지표는 허깅페이스의 오픈 LLM 리더보드에서 사용되는 평가지표 중 ‘추론 능력’ 및 ‘산출 추론 능력’ 두 개 지표로 해당 지표를 한국어에 맞게 적용함으로써 한국어 모델의 성능 평가 체계를 국제 평가 기준과 대등한 수준으로 끌어올리는 계기가 될 것으로 기대된다. 추가 지표는 AI 언어 데이터 전문 기업인 플리토가 참여해 한국어에 맞게 번역 및 개발을 지원했다. NIA 황종성 원장은 “NIA와 업스테이지는 한국어 LLM 발전을 위해 리더보드 평가 지표 및 체계를 지속적인 개선할 방침”이라며 “이를 통해 국내외 AI 연구자들 사이에서 더욱 활발한 교류와 협력이 이루어질 것으로 기대하고 있다”고 말했다. 또한 공동 운영기관인 업스테이지 박찬준 리더는 “한국 LLM 평가의 표준으로 인정받는 만큼 책임감 있는 운영을 위해 지속적으로 NIA와 노력하겠다”고 밝혔다. solidkjy@fnnews.com 구자윤 기자
2024-06-11 10:59:48