"더 똑똑하고 빨라져"...오픈AI, 최신 AI 모델 'GPT-5' 공개
[파이낸셜뉴스] 오픈AI의 차세대 플래그십 모델 GPT-5가 7일(현지시간) 출시됐다. GPT-5는 오픈AI의 일반 모델과 'o' 시리즈의 추론 모델을 통합한 것으로, 이전보다 한 단계 진보한 프런티어 모델이다. 오픈AI에 따르면 GPT-5는 이 같은 최고의 기능을 하나로 통합해, 모델을 고를 필요 없이 최상의 답변을 제공하도록 설계됐다. 특히 이전보다 더 정확해졌고, 환각(hallucination)은 줄어든 것이 특징이다. 환각이 줄어들어 이전의 어떤 추론 모델보다 더 정확한 답변을 제공한다는 것이 오픈AI 설명이다. 또 '안전한 응답'도 강화됐다. 사용자의 프롬프트에 따라 단순히 거부하거나 그대로 따르지 않고, 안전한 범위 내에서 가능한 한 도움이 되는 답변을 제공하는 것으로, 도움을 줄 수 없는 경우에는 그 이유를 명확하게 설명한다. 수학과 과학, 코딩 등 주요 벤치마크 테스트에서 최첨단 성능을 기록했다. GPT-5는 지금까지 출시한 모델 중 코딩 성능이 가장 뛰어나다. 프론트엔드 디자인에도 강하며, 코딩 지식이 전혀 없어도 웹사이트, 앱, 게임을 쉽게 만들 수 있다고 오픈AI 측은 전했다. 오픈AI는 챗GPT를 무료 이용자를 포함해 챗GPT 모든 이용자에게 제공한다고 밝혔다. 다만 구독 티어 간에는 이용 한도 측면에서 차이가 있다. 플러스(Plus) 유료 사용자들은 더 높은 사용량과 향상된 버전을 경험할 수 있고, 프로(Pro) 사용자들은 무제한으로 이용 가능하다. 무료 이용자가 추론 모델을 이용 가능하게 된 것은 이번이 처음이다. 이와 함께 오픈AI 측은 GPT5가 한국어 평가 벤치마크(KMMLU) 내부 테스트에서 전문가 수준을 뛰어 넘는 점수를 기록하며 기존 모델과 비교해 더 뛰어난 성능을 보였다고 강조했다. GPT-4o에서 도입한 한글 토크나이제이션을 기반으로 지속적인 개선을 거쳐 새로운 SOTA(Standard of the Art)를 달성했다고 전했다. KMMLU는 현대 한국어부터 깊은 문화 및 역사 지식까지 평가하는 종합 언어 벤치마크다. yjjoe@fnnews.com 조윤주 기자
2025-08-08 07:44:59
SKT 초거대AI '에이닷엑스 3.1'풀었다
SK텔레콤이 24일 오픈소스 커뮤니티 허깅페이스에 독자 구축 거대언어모델(LLM)인 에이닷엑스(A.X) 3.1을 공개했다고 밝혔다. 340억개(34B)의 매개변수를 쓴 이 모델은 SKT가 데이터 학습 등 전 단계를 토대부터 직접 구축했다. 이로써 SKT는 자체 개발(from scratch) 방식의 A.X 3.1 모델 2종(표준·경량)과 기존 모델을 활용하되 대규모 학습(CPT)에 기반한 A.X 4.0 모델 2종 등 총 4개의 모델을 학술 연구나 상업 이용 등에 오픈소스로 제공한다. A.X 3.1(34B) 모델은 대표적인 한국어 능력 평가(KMMLU)에서 A.X 4.0 대비 88% 수준의 성능을 나타냈다. 한국어 및 한국 문화 평가에서는 90% 수준이었다. 아울러 SKT는 과학기술정보통신부가 주관하는 '독자 AI 파운데이션 모델 사업'에 함께 지원한 컨소시엄 내역을 공개했다. 컨소시엄에는 국내 최대 게임사 크래프톤을 비롯해 모빌리티 데이터 부분의 강자 포티투닷, 신경망처리장치(NPU) 제작사 리벨리온, AI 에이전트 라이너, AI 모델의 데이터 안정성을 확보하는 기술을 갖춘 셀렉트스타 등 다양한 분야의 회사들과 함께 학계를 대표하는 서울대학교 연구실들과 한국과학기술원(KAIST) 연구진 등이 참여한다. 또한 SKT 컨소시엄이 만드는 AI 모델을 사용하기로 의향서를 낸 업체 중에는 SK하이닉스와 SK이노베이션, SK AX, SK브로드밴드 등 SK그룹사들은 물론 SKT가 주도하는 K-AI 얼라이언스에 참여 중인 몰로코(AI광고), 씨메스(제조AI), 가우스랩스(제조AI), 스캐터랩(감성AI) 등이 포함됐다. 김태윤 SK텔레콤 파운데이션 모델 담당은 "국내 AI 생태계를 종합적으로 고려해 혁신적인 인공지능 모델을 선보일 계획"이라고 말했다. 구자윤 기자
2025-07-24 18:12:33
SKT, 독자 개발 'A.X 3.1' 공개.. 크래프톤·포티투닷 등과 AI 국가대표 도전
SK텔레콤이 24일 오픈소스 커뮤니티 허깅페이스에 독자 구축 거대언어모델(LLM)인 에이닷엑스(A.X) 3.1을 공개했다고 밝혔다. 340억개(34B)의 매개변수를 쓴 이 모델은 SKT가 데이터 학습 등 전 단계를 토대부터 직접 구축했다. 이로써 SKT는 자체 개발(from scratch) 방식의 A.X 3.1 모델 2종(표준·경량)과 기존 모델을 활용하되 대규모 학습(CPT)에 기반한 A.X 4.0 모델 2종 등 총 4개의 모델을 학술 연구나 상업 이용 등에 오픈소스로 제공한다. A.X 3.1(34B) 모델은 대표적인 한국어 능력 평가(KMMLU)에서 A.X 4.0 대비 88% 수준의 성능을 나타냈다. 한국어 및 한국 문화 평가에서는 90% 수준이었다. 아울러 SKT는 과학기술정보통신부가 주관하는 ‘독자 AI 파운데이션 모델 사업’에 함께 지원한 컨소시엄 내역을 공개했다. 컨소시엄에는 국내 최대 게임사 크래프톤을 비롯해 모빌리티 데이터 부분의 강자 포티투닷, 신경망처리장치(NPU) 제작사 리벨리온, AI 에이전트 라이너, AI 모델의 데이터 안정성을 확보하는 기술을 갖춘 셀렉트스타 등 다양한 분야의 회사들과 함께 학계를 대표하는 서울대학교 연구실들과 한국과학기술원(KAIST) 연구진 등이 참여한다. 또한 SKT 컨소시엄이 만드는 AI 모델을 사용하기로 의향서를 낸 업체 중에는 SK하이닉스와 SK이노베이션, SK AX, SK브로드밴드 등 SK그룹사들은 물론 SKT가 주도하는 K-AI 얼라이언스에 참여 중인 몰로코(AI광고), 씨메스(제조AI), 가우스랩스(제조AI), 스캐터랩(감성AI) 등이 포함됐다. 김태윤 SK텔레콤 파운데이션 모델 담당은 "각 분야 선도기업들과의 컨소시엄 구성으로 향후 소버린 AI 분야에서 새로운 성과를 만들어낼 것"이라며 "국내 AI 생태계를 종합적으로 고려해 혁신적인 인공지능 모델을 선보일 계획"이라고 말했다. solidkjy@fnnews.com 구자윤 기자
2025-07-24 09:48:44
SKT, 독자 구축 LLM '에이닷 엑스 3.1 라이트' 공개
SK텔레콤은 11일 오픈소스 커뮤니티 허깅페이스에 독자 구축 대규모언어모델(LLM)인 ‘A.X(에이닷 엑스) 3.1 라이트’를 공개했다고 밝혔다. 이번에 공개한 ‘A.X 3.1 라이트’는 SKT가 프롬 스크래치(From Scratch) 방식으로 모델 구축과 데이터 학습 등 전 단계를 직접 진행했으며 70억개(7B)의 매개변수를 기반으로 하는 경량 모델이다. ‘A.X 3.1 라이트’는 기존 에이닷 전화 통화요약에 적용했던 A.X 3.0 라이트 모델의 업그레이드 버전으로, 전작의 강점인 경량화된 성능과 높은 효율성을 이어받았다. 이러한 장점은 정보 처리 용량, 소비 전력 등 다양한 사양의 모바일 기기에서 최적의 품질을 구현할 수 있도록 해 기업들의 원활한 서비스 제공에 기여할 수 있을 것으로 기대된다. 또한 ‘A.X 3.1 라이트’는 같은 규모의 매개변수를 바탕으로 하는 자매 LLM인 ‘A.X 4.0 라이트’와 동등한 수준의 우수한 한국어 처리능력을 갖췄다. 대표적인 한국어 능력 평가 벤치마크인 KMMLU에서 ‘A.X 3.1 라이트’(61.70)는 ‘A.X 4.0 라이트’(64.15)대비 96% 수준의 성능을 나타냈고, 한국어 및 한국 문화 벤치마크인 CLIcK에서는 ‘A.X 3.1 라이트’(71.22)가 ‘A.X 4.0 라이트’(69.97) 대비 102% 수준의 성능을 기록했다. SKT는 향후 보유 LLM을 꾸준히 오픈소스로 공개할 예정으로, ‘A.X 3.1 라이트’ 후속인 매개변수 340억개(34B)의 프롬 스크래치 모델인 A.X 3.1역시 이달 중 발표할 예정이다. SKT는 프롬 스크래치 방식 개발 등 LLM 관련 기술 역량을 지속 고도화할 예정이다. SKT는 2018년부터 AI 언어 모델을 개발해 2019년 KoBERT를 고객센터 챗봇 등에 활용하기 시작했고 2020년 국내 최초로 GPT2를 한국어로 개발해 오픈소스로 공개한 바 있다. 2022년 선보인 A.(에이닷) 서비스에는 자체 개발한 A.X 모델을 적용해 자유 주제로 대화가 가능하게 했으며 작년 A.X 3.0 모델을 에이닷 전화 통화요약 기능에 적용하기도 했다. 앞으로도 SKT는 A.X 3 계열의 소버린 AI 모델로 자생력 있는 기술을 갖추는 동시에 최적화된 성능·효율이 필요한 영역에는 대규모 학습(CPT, Continual Pre-Training)에 기반한 A.X 4 계열 모델을 활용할 예정이다. 이러한 투 트랙 전략을 통해 국내 기업들이 각자의 환경에서 AI 기술을 보다 쉽게 활용할 수 있는 다양한 선택지를 제공한다는 방침이다. 또한 기존 모델의 성능을 대폭 혁신할 수 있도록 그래픽처리장치(GPU) 자원을 확충하고 개발 역량을 높여 나갈 계획이다. SKT는 그동안 확보한 우수한 LLM 기술 역량을 바탕으로 향후 정부가 추진하는 ‘독자 AI 파운데이션 모델 개발사업’에 지원할 예정이다. 김태윤 SK텔레콤 파운데이션 모델 담당은 "꾸준히 쌓아 온 한국형 LLM 개발 역량을 바탕으로 AI 생태계 자립성을 높이고 국가 AI 경쟁력 제고에 기여하도록 노력할 것”이라고 말했다. solidkjy@fnnews.com 구자윤 기자
2025-07-11 09:36:41
KT, B2B 특화 ‘한국형 AI모델’ 독자 개발… AI 전환 가속 [소버린AI 경쟁 가세한 이통사]
통신사들이 앞다퉈 한국형 거대언어모델(LLM)을 공개한 배경에는 전통적 사업만으로는 살아남기 어렵다는 위기감이 깔려 있다. 이통 3사 가입자 수는 이미 약 5000만명에 달해 사실상 성장이 어려운 분위기다. 통신사들은 통신서비스 기반 수익 편중구조에서 벗어나기 위해 수년간 AI 기술개발에 자금을 쏟아부었다. 그 결과 최근엔 자체개발한 모델을 기반으로 AI컨택센터(AICC), AI데이터센터(AIDC) 등을 구축하며 비(非)통신사업 수익 비중을 높여왔다. ■"'믿음 2.0', 한국어 문서·문화 이해 특화" KT는 3일 기자간담회에서 '믿음 2.0'이 독자 개발한 한국형 AI모델이라는 점을 강조했다. 신동훈 KT Gen AI Lab장은 "KT는 지난 1년간 B2B 특화 한국형 AI 모델로서 믿음을 꾸준히 진화시켜 왔다"며 "한국어 문서 이해, 보고서 작성, 문서 기반 QA, 툴콜링 등 실질적인 활용에 집중했다"고 강조했다. 믿음 2.0은 파라미터 23억개(2.3B)의 미니 모델, 115억개(11.5B)의 베이스(대형) 모델로 구성된다. 향후 고성능 모델인 프로 모델도 공개할 예정이다. 2.0 미니와 베이스는 4일 오픈소스로 배포돼 누구나 상업적으로 이용할 수 있게 된다. KT는 "한국어에 최적화된 자체 도구를 활용해 학습했으며, 고품질 한국어 데이터를 수집하고 정제하는 전 과정을 자체 기술로 수행했다"고 설명했다. 데이터 수집에는 고려대 민족문화연구원, 공공기관, K데이터 얼라이언스가 핵심 역할을 했다. KT는 소버린 AI 핵심 원칙으로 △데이터 주권 △사용자 선택권 △한국적 가치 반영 △책임 있는 운영 등 네 가지를 제시했다. KT 관계자는 "고려대와 공동 개발한 한국어 AI 역량 평가지표인 '코-소버린(Ko-Sovereign)' 벤치마크에서 유사 규모의 국내 기성 모델을 비롯해 글로벌 최고 수준의 오픈소스 모델을 능가하는 점수를 기록했다"고 말했다. 이와 함께 '한국어 대규모 다중과제 언어 이해 평가'(KMMLU), 한국어 언어모델 평가지표인 '해례(HAERAE)'에서도 믿:음은 국내외 주요 오픈소스 모델보다 더 우수한 성능을 기록했다는 것이 KT 측의 설명이다. 이날 SKT가 오픈소스로 공개한 A.X 4.0은 알리바바 AI 모델 '큐원'(Qwen) 2.5에 한국어 데이터를 추가로 학습시킨 모델이다. 자체 테스트 결과 같은 한국어 문장을 입력했을 때 GPT-4o보다 33%가량 높은 효율을 기록했다. 한국어능력평가 벤치마크인 KMMLU에서 78.3점을 받아 GPT-4o(72.5점)보다 높았다. 한국어 및 한국 문화 벤치마크인 'CLIcK'에서도 83.5점으로 GPT-4o(80.2점)보다 높았다. ■이통사들 AIDC서 수익 본격화 그동안 AI 사업의 과제였던 수익화는 데이터센터에서 본격화되는 분위기다. SKT는 올해 1·4분기 AI 데이터센터 사업이 전년 동기 대비 11.1% 성장한 1020억원의 매출을 냈다. SKT는 아마존웹서비스(AWS)와 울산에 국내 최대 데이터센터를 짓기로 했으며, 수도권에도 신규 데이터센터 건립을 논의 중이다. KT는 경기 부천에 데이터센터를 추가로 설립할 예정이다. KT에서 기업 대상 데이터센터와 클라우드 사업을 진행하는 KT클라우드도 올해 1·4분기 2491억원의 매출을 기록하며 지난해 같은 기간보다 42.2% 급성장했다. LG유플러스 역시 올해 1·4분기 873억원의 데이터센터 매출을 내며 전년 동기 대비 2.1% 증가했다. LG유플러스도 지난 5월 경기 파주 데이터센터 전산 1동 착공에 들어갔다. 이 같은 인프라 확보는 통신 3사에서 개발 중인 AI 에이전트 서비스, LLM 개발역량과도 맞닿아 있다. 통신 3사 모두 관련 사업의 고도화를 이어가는 가운데 정부가 추진 중인 독자 AI 파운데이션 모델 프로젝트에 참여할 경우 사업에 더 탄력이 붙을 것으로 기대하고 있다. 다만 챗GPT가 벌써 국내 LLM 시장을 지배하는 조짐을 보이고 있다는 점은 넘어야 할 산이다. solidkjy@fnnews.com 구자윤 기자
2025-07-03 18:31:36
"믿을 만한 AI가 온다"..."KT '믿음 2.0', 1년간 한국어 담금질한 LLM"
통신사들이 앞다퉈 한국형 대규모언어모델(LLM)을 공개한 배경에는 전통적 사업만으로 살아남기 어렵다는 위기감이 깔려 있다. 이통3사 가입자 수는 이미 약 5000만명에 달해 사실상 성장이 어려운 분위기다. 통신사들은 통신서비스 기반 수익 편중구조에서 벗어나기 위해 수년간 판단해 수년간 AI 기술 개발해 자금을 쏟아부었다. 그 결과 최근엔 자체개발한 모델을 기반으로 AI컨택센터(AICC), AI데이터센터(AIDC) 등을 구축하며 비(非)통신사업 수익 비중을 높여왔다. ■"'믿음 2.0', 한국어 문서·문화 이해 특화" KT는 이날 기자간담회에서 '믿음 2.0'이 독자 개발한 한국형 AI모델이라는 점을 강조했다. 신동훈 KT Gen AI Lab장은 "KT는 지난 1년간 B2B 특화 한국형 AI 모델로서 믿음을 꾸준히 진화시켜왔다"며 "한국어 문서 이해, 보고서 작성, 문서 기반 QA, 툴콜링 등 실질적인 활용에 집중했다"고 강조했다. 믿음 2.0은 파라미터 23억개(2.3B)의 미니 모델, 115억개(11.5B)의 베이스 모델로 구성된다. 향후 고성능 모델인 프로 모델도 공개할 예정이다. 2.0 미니와 베이스는 오는 4일 라이선스로 오픈소스 배포돼 누구나 상업적으로 이용할 수 있게 된다. KT는 "한국어에 최적화된 자체 도구를 활용해 학습했으며, 고품질 한국어 데이터를 수집하고 정제하는 전 과정을 자체 기술로 수행했다"고 설명했다. 데이터 수집에는 고려대 민족문화연구원, 공공기관, K 데이터 얼라이언스가 핵심 역할을 했다. KT는 소버린 AI 핵심 원칙으로 △데이터 주권 △사용자 선택권 △한국적 가치 반영 △책임 있는 운영 등 네 가지를 제시했다. KT 관계자는 "고려대와 공동 개발한 한국어 AI 역량 평가 지표인 ‘코-소버린(Ko-Sovereign)’ 벤치마크에서 유사 규모의 국내 기성 모델을 비롯해 글로벌 최고 수준의 오픈소스 모델을 능가하는 점수를 기록했다"고 말했다. 이와 함께 ‘KMMLU’, 한국어 언어모델 평가 지표인 ‘HAERAE’에서도 믿음은 국내외 주요 오픈소스 모델보다 더 우수한 성능을 기록했다는 것이 KT 측 설명이다. 이날 SKT가 오픈소스로 공개한 A.X 4.0은 알리바바 AI 모델 ‘큐원’(Qwen) 2.5에 한국어 데이터를 추가로 학습시킨 모델이다. 자체 테스트 결과 같은 한국어 문장을 입력했을 때 GPT-4o보다 약 33% 가량 높은 효율을 기록했다. 한국어 능력 평가 벤치마크인 '한국어 대규모 다중과제 언어 이해 평가'(KMMLU) 에서 78.3점을 받아 GPT-4o(72.5점)보다 높았다. 한국어 및 한국 문화 벤치마크인 'CLIcK'에서도 83.5점으로 GPT-4o(80.2점)보다 더 높았다. ■이통사들 AIDC서 수익 본격화 그동안 AI 사업의 과제였던 수익화는 데이터센터에서 본격화되는 분위기다. SKT는 올해 1·4분기 AI 데이터센터 사업이 전년 동기 대비 11.1% 성장한 1020억의 매출을 냈다. SKT는 아마존웹서비스(AWS)와 울산에 국내 최대 데이터센터를 짓기로 했으며 수도권에도 신규 데이터센터 건립을 논의 중이다. KT는 부천에 데이터센터를 추가로 설립할 예정이다. KT에서 기업 대상 데이터센터와 클라우드 사업을 진행하는 KT클라우드도 올해 1·4분기 2491억원의 매출을 기록하며 지난해 같은 기간보다 42.2% 급성장했다. LG유플러스 역시 올해 1·4분기 873억원의 데이터센터 매출을 내며 전년 동기 대비 2.1% 증가했다. LG유플러스도 지난 5월 경기 파주 데이터센터 전산 1동 착공에 들어갔다. 이 같은 인프라 확보는 통신 3사에서 개발 중인 AI 에이전트 서비스, LLM 개발 역량과도 맞닿아 있다. 통신 3사 모두 관련 사업의 고도화를 이어가는 가운데, 정부가 추진 중인 독자 AI 파운데이션 모델 프로젝트에 참여할 경우 사업에 더 탄력이 붙을 것으로 기대하고 있다. 다만 챗GPT가 벌써 국내 LLM 시장을 지배하는 조짐을 보이고 있다는 점은 넘어야 할 산이다. 모바일인덱스에 따르면 챗GPT는 이른바 ‘지브라 프사’ 열풍으로 4월부터 3달 연속 월간활성이용자수(MAU) 1000만명을 달성한 반면 SKT 에이닷, 뤼튼테크놀로지스 뤼튼은 올해 들어 사용자수가 꾸준히 감소하면서 지난달 기준 MAU 약 138만명, 92만명을 기록했다. solidkjy@fnnews.com 구자윤 기자
2025-07-03 15:52:48
SK텔레콤, 에이닷 엑스 4.0 지식형 모델 오픈소스 공개
SK텔레콤은 세계 최고 수준의 한국어 처리 능력을 가진 한국어 특화 대형언어모델(LLM)인 A.X(에이닷 엑스) 4.0을 오픈소스로 공개했다고 3일 밝혔다. SKT는 이날 오전 세계적인 오픈소스 커뮤니티 허깅페이스를 통해 A.X 4.0의 표준 모델과 경량 모델 2종을 공개했다. 이번에 공개한 A.X 4.0은 현존 대규모 언어 모델(LLM) 중에서도 최상급의 한국어 처리 효율성은 물론 데이터 보안을 고려한 설계, 로컬 환경에서의 운영 가능성 등이 강점이다. 오픈소스 모델인 Qwen2.5에 방대한 한국어 데이터를 추가로 학습시켜 국내 비즈니스 환경에 최적화된 성능을 발휘한다. SKT는 A.X 4.0의 토크나이저1)를 자체 설계, 적용해 높은 수준의 한국어 처리 역량을 구현했다. 자체 테스트 결과 같은 한국어 문장을 입력했을 때 GPT-4o보다 A.X 4.0이 약 33%가량 높은 토큰 효율을 기록하며 다른 LLM 대비 높은 정보 처리용량에 비용 절감까지 가능한 경제성을 갖췄다. 또한 A.X 4.0은 대표적인 한국어 능력 평가 벤치마크인 KMMLU에서 78.3점을 기록해 GPT-4o(72.5점)보다 우수한 성능을 보였으며, 한국어 및 한국 문화 벤치마크인 CLIcK에서도 83.5점을 획득해 GPT-4o(80.2점)보다 더 높은 한국 문화 이해도를 입증했다. 이와 함께 SKT는 A.X 4.0를 기업 내부 서버에 직접 설치해 사용할 수 있는 온프레미스 방식으로 제공해 기업들이 데이터 보안에 대한 걱정을 덜 수 있도록 서비스할 계획이다. 특히 A.X 4.0 개발 과정에서도 대규모 학습(CPT)의 전 과정을 외부와 연동없이 자체 데이터로 학습해 데이터의 주권도 확보한 바 있다. 또한 표준 모델은 720억개(72B), 경량 모델은 70억개(7B)의 매개변수를 갖춰 이용자들이 목적에 맞춰 선택적으로 이용할 수 있도록 했다. SKT는 이미 A.X4.0을 지난 5월 에이닷 통화 요약에 적용, 성공적으로 활용하고 있으며 추후 자사는 물론 SK그룹 내 다양한 서비스에 적용할 계획이다. SKT는 이번 A.X 4.0 지식형 모델의 오픈소스 공개와 동시에 추론형 모델 발표도 앞두고 있다. SKT는 이달 중 수학 문제 해결과 코드 개발 능력이 강화된 추론형 모델을 공개하고 이미지와 텍스트를 동시에 이해하고 처리할 수 있는 수준까지 모델을 업데이트할 계획이다. 또한 소버린 AI 관점에서 A.X 3.0에 적용한 프롬 스크래치 방식도 병행해 개발을 진행하고 있으며 후속 모델도 순차적으로 선보일 예정이다. 김지원 SK텔레콤 AI Model Lab장은 "SK텔레콤의 다양한 서비스를 고도화하고 기업 시장에서 한국어 특화 LLM으로 국내 비즈니스 환경에 최적화된 모델이 될 수 있도록 지속적인 기술 개발을 추진할 계획”이라고 말했다. solidkjy@fnnews.com 구자윤 기자
2025-07-03 08:57:36
KT, 한국적 AI '믿:음 2.0' 오픈소스 공개.. 대한민국 AI 대중화 나선다
KT는 '한국적 인공지능(AI)' 철학을 담아 자체 개발한 대규모언어모델(LLM) ‘믿:음 2.0’의 오픈소스를 AI 개발자 플랫폼 허깅페이스를 통해 공개할 예정이라고 3일 밝혔다. 이 오픈소스는 기업과 개인, 공공 누구나 상업적으로 활용할 수 있도록 제약 없이 개방된다. ■ 최대 115억 파라미터 규모의 오픈소스 ‘한국적 AI’는 KT의 AI 철학으로 한국의 정신과 방식, 지식을 기반으로 구현해 한국에 가장 잘 맞는 AI를 의미한다. 이를 위해 KT는 한국의 사회적 맥락과 같은 무형의 요소와 한국어 고유의 언어적·문화적 특성 등을 충분히 반영해 학습한 AI 모델을 개발해 대한민국의 산업과 일상 속 AI 대중화에 앞장선다는 방침이다. KT의 믿:음은 사전 학습부터 자체적으로 만든 한국적 독자 AI 모델로서 고품질 한국어 데이터를 준비하는 과정에서 모든 저작권을 확보해 신뢰성을 높였다. 2023년 믿:음 1.0 버전의 스탠다드, 프리미엄 2종을 출시한 이래 KT AI 고객센터(AICC), 지니TV, AI 전화, 100번 고객센터 등 다양한 서비스에 폭넓게 활용해 왔다. 이번에 KT가 한국적 AI라는 철학을 담아 새롭게 선보이는 믿:음 모델은 △115억 파라미터 규모의 ‘믿:음 2.0 베이스’ △23억 파라미터 규모의 ‘믿:음 2.0 미니’ 2종으로 모두 한국어와 영어를 지원한다. 믿:음 2.0 베이스는 범용 서비스에 적합한 모델로 한국 특화 지식과 문서 기반의 질의 응답에서 강력한 성능을 나타낸다. 믿:음 2.0 미니는 베이스 모델에서 증류한 지식을 학습한 소형 모델이다. 110억 파라미터 이상의 한국어 범용 LLM을 누구나 상업적으로 활용할 수 있는 오픈소스로 공개한 것은 KT가 처음이라는 것이 회사 측 설명이다. KT는 믿:음 모델이 한국어와 한국 문화 및 사회 등의 전문 분야에서 기존 국내외 주요 모델을 상회하는 이해력과 생성 성능을 입증했다고 강조했다. KT와 고려대학교가 공동 개발한 한국어 AI 역량 평가 지표인 ‘코-소버린(Ko-Sovereign)’ 벤치마크에서 유사 규모의 국내 기성 모델을 비롯해 글로벌 최고 수준의 오픈소스 모델을 능가하는 점수를 기록했다. 이와 함께 한국과 관련한 전문 지식의 이해도를 측정하는 대표적 벤치마크 ‘KMMLU’와 한국어 언어모델 평가 지표인 ‘HAERAE’에서도 믿:음은 국내외 주요 오픈소스 모델보다 더 우수한 성능을 기록했다. ■ "한국 문화·언어 이해한 AI 모델".. AI 대중화 나선다 KT는 국내 교육용 도서와 문학 작품 등의 발간물, 법률 및 특허 문서, 각종 사전 등 다양한 산업·공공·문화 영역에서 방대한 한국 특화 데이터를 확보해 믿:음 2.0 학습에 활용했다. 또 저작권 이슈가 있는 데이터는 모두 제거했다. 이 밖에도 한국어의 구조와 언어학적 특성을 반영한 토크나이저를 자체 개발하고 필터링으로 줄어든 데이터 규모는 데이터 합성 방법론을 적용해 보완했다. 이를 통해 한국 사회 고유의 언어와 문화적 맥락을 정교하게 반영해 한국어 사용자에 최적화된 언어 이해 능력과 정밀한 표현력을 지닌 모델로 구현했다. 고려대학교 민족문화연구원과의 산학 협력을 통해 ‘한국적 AI’로서 믿:음 2.0의 학술적 신뢰도도 확보했다. 특히 KT는 믿:음 2.0은 AI의 윤리성 및 신뢰성을 높이기 위해 국내외 정책과 가이드라인을 기반으로 전문가들과 함께 만든 ‘AI 영향 평가 체계’를 적용해 보다 안전하고 투명한 기술을 구현하는 데 힘썼다. 또 믿:음 개발 단계에서 리벨리온과 긴밀히 협력하며 국산 AI 반도체에서의 동작을 최적화했고, 프렌들리AI와 함께 사용자가 별도 설치 과정 없이도 허깅페이스를 통해 무료로 체험할 수 있는 환경도 한시적으로 제공한다. KT는 믿:음 2.0을 공개하며 본격적으로 국내 AI 생태계에 ‘한국적 AI’ 확산 선도에 나선다. 마이크로소프트와의 협업으로 GPT-4에 한국적 사고를 추가 학습시키는 방식의 모델 또한 순차 공개할 예정이다. KT Gen AI Lab장(CAIO) 신동훈 상무는 “믿:음 2.0은 일반적인 생성 능력을 갖추면서도 한국의 문화와 언어를 깊이 이해하도록 고도화된 AI 모델”이라며 “이는 KT가 국내 사용자들에게 고성능 한국적 AI 모델에 대한 새로운 대안을 제시하는 한편 글로벌 경쟁력을 갖추게 될 중요한 발판이 될 것”이라고 말했다. solidkjy@fnnews.com 구자윤 기자
2025-07-03 08:47:44
"작지만 강하다"...업스테이지, 차세대 언어모델 '솔라 프로2' 프리뷰 공개
[파이낸셜뉴스] 업스테이지가 차세대 거대언어모델(LLM) '솔라 프로 2'의 프리뷰 버전을 공개한다고 20일 밝혔다. 오는 7월 정식 출시를 앞둔 솔라 프로 2는 지난해 12월 출시된 '솔라 프로'의 후속으로, 모델 매개변수(파라미터)는 기존 220억개에서 310억개로 확대되고 성능도 대폭 늘었다. 업스테이지 측은 솔라 프로 2가 비교적 소형 모델임에도 종합 지식(MMLU), 지시 이행(IFEval) 등 주요 LLM 벤치마크 성능 평균에서 메타의 '라마 4 스카우트'·'라마 3.3 70B', 알리바바의 '큐원 2.5 72B' 등 두 배 이상 큰 빅테크 모델들을 앞질렀다고 설명했다. 'KMMLU'·'해례'(HAE-RAE) 등 한국어 성능 벤치마크에서도 높은 점수를 기록했다고 업스테이지측은 전했다. 아울러 솔라 프로 2에는 업스테이지 LLM 최초로 '하이브리드 모드'가 적용된다. 빠른 응답을 받으려면 '챗 모드'를, 정교한 답을 받으려면 '추론 모드'를 선택할 수 있다. 기존보다 2배 확장된 6만4000 토큰까지 지원해 더 긴 문서나 대화를 한 번에 처리할 수 있게 되면서 사용성도 강화됐다. 자체 개선을 통해 한국어 및 문서 기반 작업에서 최대 30%까지 토큰 절감이 가능해졌으며 이에 따라 응답 속도와 비용 효율도 향상됐다. 김성훈 업스테이지 대표는 "솔라 프로 2는 적은 매개변수로도 빅테크가 개발한 LLM 수준의 성능을 구현하며 작지만 강력한 소형언어모델의 새 기준을 제시한다"며 "특히 최고 추론 성능에 뛰어난 한국어 성능을 갖춘 이번 모델을 통해 더 많은 업무 혁신을 기대한다"고 전했다. wongood@fnnews.com 주원규 기자
2025-05-20 09:49:30
카카오, 초거대 언어모델 '카나나 플래그' 개발 완료...최고 수준 성능
[파이낸셜뉴스] 카카오가 자체 AI 모델을 기반으로 기술력 검증과 생태계 확장에 나선다. 카카오는 자체 개발 언어모델 카나나(Kanana)의 연구 성과를 담은 테크니컬 리포트를 아카이브(ArXiv)에 공개했다. 이와 더불어 언어모델 라인업 중 국내 AI 생태계 활성화를 위해 ‘카나나 Nano 2.1B’ 모델을 오픈소스로 깃허브(GitHub)에 배포했다. 테크니컬 리포트는 매개변수와 학습 방법, 학습 데이터 등 세부 사항을 담아낸 AI 논문이다. 카카오는 이번 리포트에 다양한 사이즈에 이르는 카나나 언어모델 전체의 프리-트레이닝(Pre-training)부터 포스트-트레이닝(Post-training)까지 전 과정을 자세히 담았다. 카나나 모델의 구조, 학습 전략, 그리고 글로벌 벤치마크에서의 성과도 확인할 수 있다. 카카오의 초거대 언어모델 ‘카나나 플래그'(Kanana Flag)는 지난해 말 학습을 완료했다. 카카오는 작년 10월 개발자 컨퍼런스 ‘if(kakaoAI)2024’에서 공개한 ‘카나나 언어모델’의 전체 라인업을 모두 구축하게 됐다. ‘카나나 플래그'는 글로벌 최고 수준의 한국어·영어 성능을 달성한 모델이다. 한국어 성능을 평가하는 ‘LogicKor’, ‘KMMLU’ 벤치마크에서 타 모델을 압도하는 처리 능력을 입증했다. 영어 성능을 평가하는 ‘MT-bench’, ‘MMLU’ 벤치마크에서는 경쟁 모델과 유사한 성과를 기록했다. 또 학습 자원 최적화를 통해 유사 사이즈의 모델 대비 50% 이상 비용을 절감하며, SOTA(State-of-the-Art) 수준의 효율성과 성능을 동시에 구현해냈다. 카카오는 대규모 언어모델의 학습 효율을 극대화하고자 다양한 혁신적 학습 기법을 적용했고, 이를 통해 경량 모델 ‘카나나 나노 2.1B’부터 초거대 모델 ‘카나나 플래그 32.5B’까지 다양한 사이즈의 고성능 모델을 효율적으로 개발, 글로벌 유사 크기 모델 대비 절반 이하의 학습 비용을 실현했다고 강조했다. 카카오는 향후 카나나 모델에 강화 학습과 연속 학습 기반의 최신 기술을 접목해 추론, 수학,코딩 능력을 강화하고, 정렬(Alignment) 기술을 고도화해 사용자 요청의 수행 정확도를 높일 계획이다. 이를 통해 음성, 이미지, 영상 등 다양한 형태로 소통 가능하도록 지속적 모델 고도화를 이어가며, 일상에 실질적인 가치를 더하는 기술로 자리잡을 수 있도록 기술 경쟁력을 강화해 갈 예정이다. 카카오는 이번 테크니컬 리포트와 함께 자체 개발 경량 모델 ‘카나나 Nano 2.1B’를 깃허브에 오픈소스로 공개했다. ‘카나나 나노 2.1B’의 베이스 모델과 인스트럭트 모델, 임베딩 모델이 오픈소스 커뮤니티인 깃허브를 통해 제공된다. 카카오에 따르면 ‘카나나 나노 2.1B’는 연구자와 개발자가 활용하기 적절한 크기의 모델이자 온디바이스 환경에서도 활용 가능한 고성능의 경량 모델로, 비교적 작은 규모임에도 유사한 크기의 글로벌 모델에 견줄 만한 성능을 자랑한다. 지난달 카카오 공식 테크블로그를 통해 공개한 바와 같이, 한국어와 영어 처리 능력에서 뛰어난 결과를 보여준다. 카카오는 이번 오픈소스 공개를 통해 AI 기술의 접근성을 높이고자 하며, 연구자와 개발자들이 해당 모델을 토대로 다양한 응용을 시도할 수 있도록 모델의 업데이트를 지속 지원할 계획이다. 카카오 김병학 카나나 성과리더는 “모델 최적화와 경량화 기술을 바탕으로 라마, 젬마 등 글로벌 AI 모델과 견줄 수 있는 고성능의 자체 언어모델 라인업을 효율적으로 확보하게 됐으며, 이번 오픈소스 공개를 통해 국내 AI 생태계 활성화에 기여할 수 있을 것으로 기대한다”며, “앞으로도 효율과 성능 중심의 실용적이고 안전한 AI 모델을 개발해가며, 지속적 기술 혁신을 통해 AI 경쟁력을 강화해 갈 계획”이라고 말했다. yjjoe@fnnews.com 조윤주 기자
2025-02-27 10:33:12