[파이낸셜뉴스] 스터닝밸류리서치는 1일 플리토에 대해 AI(인공지능) 기반 언어모델 국내 최강 기업으로 이재명 정부가 육성하는 AI육성 정체 수혜가 기대된다고 진단했다. 다만 투자의견과 목표주가는 제시하지 않았다. 스터닝밸류리서치는 "지난 4월 14일 이재명 대통령은 10대 정치 공약을 발표했는데, 이대통령이 대선 출마 선언 때부터 강조해 온 ‘AI 세계 3대 강국 도약’은 10대 공약 중 첫번째인 ‘세계를 선도하는 경제강국’ 공약에 담겼다“라며 ”이 대통령은 당내 대선 경선 첫 일정으로 AI 스타트업을 찾으며, ‘AI 예산 비중을 선진국 수준 이상 증액과 민간 투자 100조원 시대를 열겠다고 밝힌 바 있다“라고 밝혔다. 그러면서 “또한 민주당이 밝힌 ‘모두의 AI’는 국민 모두가 선진국 수준의 AI를 무료로 활용할 수 있도록 하는 프로젝트”라며 “이에 따라 쳇GPT처럼 AI의 초석이 되는 AI기반의 언어모델을 개발해 판매하는 플리토의 수혜가 클 것으로 전망된다”라고 부연했다. AI기반 언어모델의 연구 및 개발용 데이터 판매를 하는 플리토는 자체 클라우드 플랫폼인 Arcade에서 집단지성을 활용하여, 다국어 병렬 말뭉치를 수집하고, 이를 기반으로 언어 데이터 판매와 플랫폼 사업을 지속하고 있다. 이 회사는 2023년 12월 실시간 다국어 음성 인식 및 번역 플랫폼 ‘Chat Translation’, 컨퍼런스/세미나용 동시통역 서비스 ‘Live Translation’을 런칭했다. 실제 월드컵경기장 등 주요 관광지역들, LG전자, 하나금융기업 등 기업들, 서밋아시아, 플레이엑스포 포럼 등에서 레퍼런스를 확보하며 지난 3년간 매출은 CAGR +29.5% 매년 성장하고 있다. 스터닝밸류리서치는 플리토가 올해를 기점으로 흑자전환이 가능할 것으로 봤다. 한편 2019년에 코스닥에 상장한 플리토는 AI 기반 언어 모델의 연구 및 개발용 데이터 판매△ 동사 플랫폼을 통한 번역 서비스 제공 △컨텐츠 번역 △AI 기반의 실시간 통번역 솔루션 공급 등의 사업을 영위 하고 있다. kakim@fnnews.com 김경아 기자
2025-07-01 14:06:52[파이낸셜뉴스] 카카오는 자체 개발 언어모델 ‘카나나’ 라인업 중 8B와 2.1B 크기의 모델을 오픈소스로 허깅페이스에 공개했다고 23일 밝혔다. 아파치 2.0 라이선스를 적용해 누구나 자유로운 수정과 상업적 활용이 가능하다. 이번에 공개한 모델은 지난 2월말 공개한 버전에서 성능이 한층 향상된 것으로 △카나나-1.5-8b-base △카나나-1.5-8b-instruct △카나나-1.5-2.1b-base △카나나-1.5-2.1b-instruct의 총 4종이다. 카나나 1.5는 에이젠틱 AI 구현을 위한 기능 강화에 중점을 뒀다. 글로벌 모델 대비 뛰어난 한국어 성능을 유지하며, 코딩과 수학 문제 해결, 함수 호출 능력에서 이전 대비 평균 1.5배의 성능 향상을 보였다. 긴 문맥에 대한 이해와 간결한 답변을 통해 향상된 사용성을 제공한다. 기존보다 더 긴 텍스트 입력에 대해 안정적인 처리가 가능하며, 정확도와 응답 길이를 최적화 한 답변을 통해 서비스 환경에서 사용자의 체감 성능을 높였다. 카카오는 현재 더욱 향상된 버전의 카나나2를 개발 중이다. 더욱 긴 입력에 대한 처리, 보다 정교화된 추론, 구조적인 효율성 등 다수의 영역에서 진화된 모델 개발을 진행하고 있다. 이번 오픈소스 공개를 통해 카카오는 국내 대형언어모델(LLM) 생태계의 활성화를 위한 시도와 기여를 꾸준히 이어갈 계획이다. 특히 AI 연구자와 개발자는 물론 기업이 목적에 맞게 모델을 자유롭게 튜닝하고 활용할 수 있는 상업 라이선스를 적용해, 기술 경쟁력을 확보함과 동시에 협력 기반의 AI 생태계를 구축해 나간다는 방침이다. 카카오 김병학 카나나 성과리더는 “이번 오픈소스 공개를 통해 AI 기술을 통한 성장과 경쟁을 함께하는 환경을 만들고 이러한 생태계 내에서 기술을 발전시킬 수 있는 계기를 꾸준히 마련해가고자 한다”며 “인공지능 모델 성능의 고도화는 물론 오픈소스의 본질적인 가치를 함께 추구해 갈 것”이라고 말했다. yjjoe@fnnews.com 조윤주 기자
2025-05-23 09:23:44[파이낸셜뉴스] 업스테이지가 차세대 거대언어모델(LLM) '솔라 프로 2'의 프리뷰 버전을 공개한다고 20일 밝혔다. 오는 7월 정식 출시를 앞둔 솔라 프로 2는 지난해 12월 출시된 '솔라 프로'의 후속으로, 모델 매개변수(파라미터)는 기존 220억개에서 310억개로 확대되고 성능도 대폭 늘었다. 업스테이지 측은 솔라 프로 2가 비교적 소형 모델임에도 종합 지식(MMLU), 지시 이행(IFEval) 등 주요 LLM 벤치마크 성능 평균에서 메타의 '라마 4 스카우트'·'라마 3.3 70B', 알리바바의 '큐원 2.5 72B' 등 두 배 이상 큰 빅테크 모델들을 앞질렀다고 설명했다. 'KMMLU'·'해례'(HAE-RAE) 등 한국어 성능 벤치마크에서도 높은 점수를 기록했다고 업스테이지측은 전했다. 아울러 솔라 프로 2에는 업스테이지 LLM 최초로 '하이브리드 모드'가 적용된다. 빠른 응답을 받으려면 '챗 모드'를, 정교한 답을 받으려면 '추론 모드'를 선택할 수 있다. 기존보다 2배 확장된 6만4000 토큰까지 지원해 더 긴 문서나 대화를 한 번에 처리할 수 있게 되면서 사용성도 강화됐다. 자체 개선을 통해 한국어 및 문서 기반 작업에서 최대 30%까지 토큰 절감이 가능해졌으며 이에 따라 응답 속도와 비용 효율도 향상됐다. 김성훈 업스테이지 대표는 "솔라 프로 2는 적은 매개변수로도 빅테크가 개발한 LLM 수준의 성능을 구현하며 작지만 강력한 소형언어모델의 새 기준을 제시한다"며 "특히 최고 추론 성능에 뛰어난 한국어 성능을 갖춘 이번 모델을 통해 더 많은 업무 혁신을 기대한다"고 전했다. wongood@fnnews.com 주원규 기자
2025-05-20 09:49:30[파이낸셜뉴스] 카카오가 자체 AI 모델을 기반으로 기술력 검증과 생태계 확장에 나선다. 카카오는 자체 개발 언어모델 카나나(Kanana)의 연구 성과를 담은 테크니컬 리포트를 아카이브(ArXiv)에 공개했다. 이와 더불어 언어모델 라인업 중 국내 AI 생태계 활성화를 위해 ‘카나나 Nano 2.1B’ 모델을 오픈소스로 깃허브(GitHub)에 배포했다. 테크니컬 리포트는 매개변수와 학습 방법, 학습 데이터 등 세부 사항을 담아낸 AI 논문이다. 카카오는 이번 리포트에 다양한 사이즈에 이르는 카나나 언어모델 전체의 프리-트레이닝(Pre-training)부터 포스트-트레이닝(Post-training)까지 전 과정을 자세히 담았다. 카나나 모델의 구조, 학습 전략, 그리고 글로벌 벤치마크에서의 성과도 확인할 수 있다. 카카오의 초거대 언어모델 ‘카나나 플래그'(Kanana Flag)는 지난해 말 학습을 완료했다. 카카오는 작년 10월 개발자 컨퍼런스 ‘if(kakaoAI)2024’에서 공개한 ‘카나나 언어모델’의 전체 라인업을 모두 구축하게 됐다. ‘카나나 플래그'는 글로벌 최고 수준의 한국어·영어 성능을 달성한 모델이다. 한국어 성능을 평가하는 ‘LogicKor’, ‘KMMLU’ 벤치마크에서 타 모델을 압도하는 처리 능력을 입증했다. 영어 성능을 평가하는 ‘MT-bench’, ‘MMLU’ 벤치마크에서는 경쟁 모델과 유사한 성과를 기록했다. 또 학습 자원 최적화를 통해 유사 사이즈의 모델 대비 50% 이상 비용을 절감하며, SOTA(State-of-the-Art) 수준의 효율성과 성능을 동시에 구현해냈다. 카카오는 대규모 언어모델의 학습 효율을 극대화하고자 다양한 혁신적 학습 기법을 적용했고, 이를 통해 경량 모델 ‘카나나 나노 2.1B’부터 초거대 모델 ‘카나나 플래그 32.5B’까지 다양한 사이즈의 고성능 모델을 효율적으로 개발, 글로벌 유사 크기 모델 대비 절반 이하의 학습 비용을 실현했다고 강조했다. 카카오는 향후 카나나 모델에 강화 학습과 연속 학습 기반의 최신 기술을 접목해 추론, 수학,코딩 능력을 강화하고, 정렬(Alignment) 기술을 고도화해 사용자 요청의 수행 정확도를 높일 계획이다. 이를 통해 음성, 이미지, 영상 등 다양한 형태로 소통 가능하도록 지속적 모델 고도화를 이어가며, 일상에 실질적인 가치를 더하는 기술로 자리잡을 수 있도록 기술 경쟁력을 강화해 갈 예정이다. 카카오는 이번 테크니컬 리포트와 함께 자체 개발 경량 모델 ‘카나나 Nano 2.1B’를 깃허브에 오픈소스로 공개했다. ‘카나나 나노 2.1B’의 베이스 모델과 인스트럭트 모델, 임베딩 모델이 오픈소스 커뮤니티인 깃허브를 통해 제공된다. 카카오에 따르면 ‘카나나 나노 2.1B’는 연구자와 개발자가 활용하기 적절한 크기의 모델이자 온디바이스 환경에서도 활용 가능한 고성능의 경량 모델로, 비교적 작은 규모임에도 유사한 크기의 글로벌 모델에 견줄 만한 성능을 자랑한다. 지난달 카카오 공식 테크블로그를 통해 공개한 바와 같이, 한국어와 영어 처리 능력에서 뛰어난 결과를 보여준다. 카카오는 이번 오픈소스 공개를 통해 AI 기술의 접근성을 높이고자 하며, 연구자와 개발자들이 해당 모델을 토대로 다양한 응용을 시도할 수 있도록 모델의 업데이트를 지속 지원할 계획이다. 카카오 김병학 카나나 성과리더는 “모델 최적화와 경량화 기술을 바탕으로 라마, 젬마 등 글로벌 AI 모델과 견줄 수 있는 고성능의 자체 언어모델 라인업을 효율적으로 확보하게 됐으며, 이번 오픈소스 공개를 통해 국내 AI 생태계 활성화에 기여할 수 있을 것으로 기대한다”며, “앞으로도 효율과 성능 중심의 실용적이고 안전한 AI 모델을 개발해가며, 지속적 기술 혁신을 통해 AI 경쟁력을 강화해 갈 계획”이라고 말했다. yjjoe@fnnews.com 조윤주 기자
2025-02-27 10:33:12[파이낸셜뉴스] 범정부 인공지능(AI)정책의 컨트롤 타워인 국가AI위원회가 세계 최고의 거대언어모델(LLM)을 만들겠다는 목표로 '월드 베스트 LLM(가칭)' 프로젝트를 가동한다. 치열한 경쟁이 전개되는 글로벌 AI 생태계에서 우리나라의 AI 경쟁력을 획기적으로 제고할 수 있도록 세계 수준의 AI 모델 개발과 최고급 인재 양성을 추진하는 한편, AI 컴퓨팅 자원 및 데이터 등 인프라를 확충하고 전면적인 AI 산업화와 국가 AI 전환을 가속화한다는 계획이다. 20일 오전 서울 중구 국가AI위원회 회의실에서 열린 3차 국가AI위원회에서 최상목 대통령 권한대행은 “글로벌 AI환경이 급변하면서 위기감이 고조되고 있지만, 우리에게는 새로운 기회로, AI 3대 강국 도약을 위해 민관이 힘을 모아 국가 AI역량 강화를 빠르게 추진해야 할 중대한 시점”이라며 “정부는 빠른 시일내에 세계 최고수준의 AI모델을 개발할 수 있도록 집중 지원하고 AI 핵심인재 양성과 해외 우수인재 유치를 강화하겠다”고 강조했다. 아울러 “컴퓨팅 자원과 데이터 등 인프라를 확충하고, AI 활용과 산업화에서 세계 1등이 될 수 있도록 AI 스타트업 육성과 시장 창출을 지원하겠다”고 덧붙였다. 이날 민간 대표로 참석한 최수연 네이버 대표는 '글로벌 AI현황 및 국내 대응방향'을 주제로 트럼프 행정부 AI정책과 중국 딥시크AI 개발이 우리 산업계에 주는 시사점을 소개하고 민간 AI원천기술 개발을 위한 정부의 인프라 투자와 산업 전반의 AI전환 지원을 강조했다. 국가AI위원회에 따르면 정부는 AI 산업 진흥책으로 'AI 국가대표 정예팀'을 선발하여 글로벌 최고 수준의 LLM 개발을 목표로 데이터·그래픽처리장치(GPU) 등 연구자원을 집중 지원하는 프로젝트를 추진하고 정예팀이 필요한 글로벌 핵심인재를 유치할 수 있도록 연구비 등 지원을 확대한다는 계획을 세웠다. 우수 AI 모델은 공공·민간 영역으로 활용을 확산하고 AI 연구자들과 개방형 혁신을 가속화할 수 있는 공유 체계를 마련한다. 이를 통해 1조원 규모의 범용 인공지능(AGI) 핵심원천기술 확보에 도전한다는 방침이다. 또 최고급 AI 인재를 양성・확보하기 위해 AI분야 도전적 문제를 해결하는 ‘글로벌 AI챌린지’를 개최를 추진하고 작년 미국에 개소한 ‘글로벌 AI 프론티어 랩'을 유럽 등 다른 국가로 확대할 계획이다. 국내 AI 신진연구자를 집중 지원하는 프로그램을 마련하는 한편 기업이 원하는 AI 융합 인재를 양성하기 위해 산학 협력형 AX 대학원 신설을 추진하고, 혁신형 교육을 강화할 계획도 세웠다. 현장의 시급한 AI컴퓨팅 수요에 신속히 대응하기 위해 2026년 상반기까지 국가AI컴퓨팅센터, 슈퍼컴 6호기에 총 1만8000장 규모의 컴퓨팅 자원(고성능 GPU)을 확보할 예정이다. AI 학습을 위한 양질의 공공·민간데이터도 확충하고 개방을 확대한다. 그간 자율주행 분야에만 허용되었던 비정형 원본데이터(영상 등) 활용을 사회적·산업적으로 필요한 분야로 확대하는 한편, AI 연구에 필요한 기간 동안 데이터를 안정적으로 활용할 수 있도록 개인정보 활용특례를 마련하고 범죄 예방 등 공익적 AI개발을 위해 개인정보를 활용할 수 있도록 적법 처리근거를 확대할 계획이다. 의료·국방 등 민감분야에서도 합성데이터와 생성형 AI 고도화를 위한 미디어, 산업·제조, 금융 등 분야별 특화 데이터를 구축·개방하고, 공공데이터 중 AI 수요가 높은 비정형데이터, 합성데이터 등을 국가 중점 데이터로 적극 개방한다. 아울러 공공기관의 가명처리 내부 운영체계를 개선하고 공공기관 경영평가 등 가명정보 제공실적을 반영하여 공공데이터 개방을 촉진한다. 정부는 우리 기업이 개발한 혁신적 AI서비스가 국내·외 시장에 조기 확산돼 수요 창출과 경쟁력 강화로 이어질 수 있도록 지원할 예정이다. 의료·법률·미디어·문화·재난·안전 등 산업 파급력과 대국민 체감이 높은 분야를 중심으로 부처 협업을 통해 생성형 AI 기반의 서비스를 개발한다. 아울러 AI 공급 역량 강화를 위해 AI 스타트업의 성장을 지원한다. 2027년까지 정부, 민간 자금 등 약 3조원 규모의 AI 집중펀드를 조성·운용해 AI 스타트업에 대한 자금지원을 대폭 확대한다. 정부 관계자는 "앞으로도 정부는 국가인공지능위원회를 구심점으로 범부처 AI 역량을 결집하고, 국가 AI정책의 추동력을 강화해 나갈 계획"이라며 "특히 글로벌 AI 동향을 면밀히 주시하면서, 민·관이 함께 현장의 요구에 대한 해결 방안을 모색하고, 신속히 구체화해 나갈 예정"이라고 전했다. wongood@fnnews.com 주원규 기자
2025-02-20 11:23:05[파이낸셜뉴스] 한국거래소는 20일 서울 사옥에서 '제3회 KRX 금융 언어모델 경진대회' 시상식을 개최했다고 밝혔다. 지난 10월부터 약 두 달간 개최된 이번 대회는 인공지능(AI) 등 첨단 기술에 기반한 데이터사업 추진 기반을 마련하고, 미래사업본부 출범 후 KRX의 미래 성장동력을 확보하기 위해 마련됐다. 거래소는 참가자의 ‘오픈소스 언어 모델과 공공 데이터를 바탕으로 한 금융특화 거대언어모델(LLM)에 대해 △KRX-Bench 점수(언어모델 성능 평가를 위한 표준데이터), △현장 발표점수 △학습계획서를 종합해 평가했다. 이번 대회에는 총 224팀이 예선에 참가했으며, 이중 본선 진출 30개 팀 중 5개 팀을 최종 수상팀으로 선정했다. 거래소 정은보 이사장은 시상식에서 축사를 통해 “최근 금융 산업에도 방대한 데이터를 분석하기 위한 도구로써 AI 기술에 대한 수요가 높아졌다”며 “장기적으로는 거래소도 데이터 제공 환경을 클라우드로 전환해 고객이 직접 AI를 활용 분석하는 환경을 도입할 계획"이라고 전했다. 한편 거래소는 데이터 경진대회를 지속적으로 개최해 한국 자본시장 대표 데이터 경진대회로 발전시킬 계획이다. hippo@fnnews.com 김찬미 기자
2024-12-20 17:08:34한글과컴퓨터의 인공지능(AI) 제품에 LG AI연구원의 대규모 언어모델 '엑사원(EXAONE)'을 AI 엔진으로 활용될 것으로 보인다. 한컴 측은 엑사원을 활용하는 AI 제품이 나올 경우 더욱 신뢰도 높은 AI 서비스를 제공할 수 있을 것으로 기대하고 있다. 한컴은 LG AI연구원과 AI 사업 협력을 위한 전략적 파트너십을 체결했다고 12일 밝혔다. 이번 협약을 통해 양사는 AI 기술 및 서비스 분야에서 긴밀한 협력 관계를 구축하고, 각 사의 핵심 역량을 결합해 시너지를 극대화할 방침이다. 김연수 한컴 대표는 "앞으로 LG AI연구원과 협력하며 AI 기술 강화 및 서비스 영역 확장에 박차를 가할 것"이라며, "각 사의 강점을 적극 활용해 공공과 민간 분야의 디지털 전환을 가속하고, 국내 AI 생태계 발전에도 기여하겠다"고 말했다. 이번 협력은 한컴의 시장 내 입지와 경쟁력을 LG AI연구원의 첨단 AI 기술과 결합한 사례로 주목받고 있다. 한컴은 30년 이상 축적한 문서 설루션 기술력과 폐쇄망 환경에서의 안정적인 AI 서비스 제공 역량을 입증해 왔다. 김만기 기자
2024-12-12 18:48:34[파이낸셜뉴스] 업스테이지는 아마존웹서비스(AWS)를 통해 자사의 차세대 LLM ‘솔라 프로’를 정식 출시했다고 5일 밝혔다. 솔라 프로는 ‘아마존 베드락 마켓플레이스’, ‘아마존 세이지메이커 점프스타트’, AWS 마켓플레이스’ 등 AWS 주요 플랫폼에 탑재, 전 세계 기업들을 대상으로 자사 맞춤형 생성형 AI 서비스 도입을 지원한다. 솔라 프로는 220억 매개변수(파라미터) 모델로 기존 ‘솔라 미니’(107억) 대비 두 배 이상 커지고 성능도 50% 이상 향상됐다. 금융, 법률, 헬스케어 등 다양한 산업별 전문지식을 기반으로 뛰어난 문맥 이해와 추론 능력을 갖췄다. 기업이 보유한 데이터를 학습시키면 복잡한 맞춤형 업무를 높은 정확도로 처리한다. 앞서 업스테이지는 솔라 프로 개발을 위해 AI 모델 개발·배포 서비스 '아마존 세이지메이커’를 활용, 모델 학습 시간을 크게 단축한 바 있다. ‘DUS(깊이 확장 스케일)’ 기술과 데이터 전처리 등 자체 모델링 방법론을 고도화해 단 1개의 GPU로 구동이 가능한 수준으로 경량화에 성공했다. 지난 9월 오픈소스로 공개한 ‘솔라 프로 프리뷰’ 버전은 허깅페이스 ‘오픈 LLM 리더보드’, 감성 지능을 평가하는 ‘EQ 벤치 리더보드’ 등 글로벌 표준 LLM 평가에서 우수한 성능을 입증했다. 미국 파인튜닝 전문 기업 프레디베이스 조사 결과 빅테크 모델을 제치고 파인튜닝 성능 1위를 기록하기도 했다. 솔라 프로는 이날부터 전 세계 100개 이상의 LLM이 탑재된 ‘아마존 베드록 마켓플레이스’에서 만날 수 있다. 고객이 원하는 모델을 찾은 후에는 확장 요구 사항에 맞는 적합한 인프라를 선택하고 완전 관리형 엔드포인트를 통해 AWS에 쉽게 배포할 수 있다. 솔라 프로는 파운데이션 모델을 제공하는 AWS의 머신러닝 허브 ‘아마존 세이지메이커 점프스타트’와 ‘AWS 마켓플레이스’에도 출시된다. 업스테이지 김성훈 대표는 “솔라 프로는 금융, 법률, 헬스케어 등 다양한 산업군에 투입돼 업무 자동화 및 효율성과 생산성을 극대화할 수 있다”며 “업스테이지는 아마존 세이지메이커 등 AWS의 강력한 인프라를 활용해 다양한 산업 도메인 업무를 자동화하고 전문가 의사결정을 지원하는 고성능 언어모델을 개발했다. AWS의 확장성과 업스테이지의 기술력의 조합으로 많은 기업들이 최신 AI 기술을 더욱 손쉽게 도입할 수 있을 것”이라고 말했다. 함기호 AWS 코리아 대표는 “업스테이지와 같은 스타트업과의 협력을 통해 기업은 효율성을 높이는 생성형 AI 솔루션을 안전하게 도입하고 맞춤화할 수 있다. AWS 파트너 네트워크(APN)는 업스테이지가 전 세계 조직에 생성형 AI 솔루션을 구축, 마케팅 및 판매할 수 있도록 구조화된 프레임워크를 제공했다. 기술 자원, 마케팅 지원, 비즈니스 개발 지원은 모두 스타트업이 모든 산업에서 혁신을 가속화할 수 있도록 특별히 설계됐으며, 업스테이지는 한국을 비롯한 전 세계의 비즈니스에 맞춤형 AI 솔루션이 기업을 지원하는 방식을 변화시키고 있다”라고 말했다. yjjoe@fnnews.com 조윤주 기자
2024-12-05 08:37:27[파이낸셜뉴스] 카카오가 AI 기술 생태계의 구축과 활성화를 위한 노력을 이어간다. 카카오는 AI 언어모델의 펑션콜(Function Call, 함수호출) 성능을 평가할 수 있는 데이터셋인 ‘펑션챗-Bench’를 구축하고, 이를 최근 오픈소스로 공개했다고 27일 밝혔다. 펑션콜이란 AI 언어모델이 자체적으로 수행할 수 없는 동작을 지시하거나 사전에 학습하지 않은 정보를 실시간 정보를 받아올 수 있도록 언어모델과 API 등의 외부 도구를 연결하는 기술을 뜻한다. 언어모델을 기반으로 하는 서비스 구현에 있어 필수적으로, 언어모델이 가진 한계를 해결해 새로운 기능으로 확장할 수 있다. 예를 들어, 모델에 펑션콜 기능을 활용해 지도 등의 특정 API를 연결하면 실시간 도로정보를 호출해 답변할 수 있게 된다. 카카오는 펑션콜 기술의 고도화를 위해 국내 IT 기업 최초로 한국어 대화 환경에서의 성능을 다면적으로 평가할 수 있는 ‘펑션챗-Bench’ 데이터셋을 구축했다. 기존의 펑션콜 성능 평가 데이터셋은 대부분 글로벌 기업에서 구축한 영어를 토대로 이루어져 있는데, 한국어 기반의 관련 데이터셋을 구축한 것은 카카오가 처음이다. 데이터셋은 △함수 이름과 인자 추출의 정확성 △함수 호출 결과 전달의 정확성 △누락 정보 인지를 통한 추가 질의 발생 여부 △호출 가능한 함수와의 관련성 감지 등을 평가하는 기준 항목으로 구성된다. 카카오가 구축한 이번 데이터셋은 함수 호출 전후에 요구되는 사용자와의 적절한 상호 작용 메시지 생성 능력까지 평가 영역으로 포함했다는 점에서 차별성을 갖는다고 카카오는 전했다. 카카오는 한국어 AI 언어모델 생태계의 활성화와 개방적 AI 환경을 위해 해당 데이터셋을 오픈소스 커뮤니티 깃허브(GitHub)에 공개했다. 향후 해당 데이터셋의 규모를 늘리고 영어 버전을 추가하는 등 사용성을 지속적으로 확장해 갈 계획이다. 카카오 김병학 카나나 알파 성과리더는 “이번 ‘펑션챗-Bench’ 데이터셋 구축 및 오픈소스 공개는 한국어 기반의 국내 AI 기술 생태계에 기여할 수 있는 의미를 지닌다”며 “펑션콜 기술의 성능 평가 토대를 처음으로 마련한 만큼, 꾸준히 데이터셋의 활용성을 높여가기 위해 노력할 계획”이라고 말했다. yjjoe@fnnews.com 조윤주 기자
2024-09-27 10:13:51[파이낸셜뉴스] 마이크로소프트가 지난 4월 출시된 소형언어모델 파이3(Phi-3)) 모델의 최신 버전인 파이 3.5 시리즈를 공개했다고 27일 밝혔다. 파이3은 언어, 추론, 코딩, 수학 등 다양한 부분에서 우수한 성능과 비용 효율을 제공하도록 설계됐다. 새롭게 공개된 파이 3.5 미니, 파이3.5 비전, 파이3.5-MoE 모델은 더욱 다양한 기능과 최적화된 고성능 옵션을 갖췄다. MS에 따르면, 파이3.5 미니는 38억 개의 파라미터로 긴 문서 요약, 정보 검색 등에서 탁월한 기능을 발휘한다. 12만 8000개의 컨텍스트 길이를 지원해 긴 문서나 회의록 처리에 강한 성능을 보여준다. MS 측은 "파이 3.5 미니는 영어 및 다양한 언어에서 고성능을 유지하며 특히 아랍어, 네덜란드어, 핀란드어 등의 언어에서 성능이 크게 개선됐다"고 전했다. 파이 3.5 비전은 멀티 프레임 이미지 이해와 추론 능력을 강화한 모델이다. 이미지 및 비디오 데이터 처리에서 뛰어난 성능을 발휘하며 슬라이드와 비디오 요약, 이미지 스토리텔링 등의 작업에서 높은 정확도와 효율성을 보여준다. 파이 3.5-MoE는 전문가 혼합(Mixture of Experts) 모델로, 총 420억 개의 파라미터 중 66억 개의 활성 파라미터를 사용한다. 보안이 강화됐고 다국어 지원을 통해 대형 모델을 능가하는 성능을 제공한다. yjjoe@fnnews.com 조윤주 기자
2024-08-27 18:35:57