중국 인공지능(AI) 스타트업 딥시크가 가성비 높은 AI 'R1'으로 충격을 주자 오픈AI가 지난 1일(현지시간) 새 저가형 추론 모델 챗GPT 'o3 미니'를 공개하며 맞불을 놨다. R1과 o3 미니의 차이는 얼마나 될까. 파이낸셜뉴스가 두 모델을 직접 테스트해본 결과 범용적 쓰임새로는 R1과 o3의 결과치가 유사했다. 가성비 측면에선 R1이 압승이다. 다만 정밀 추론이 필요한 영역에선 R1이 o3 미니를 따라가기엔 무리였다. ■딥시크 R1은 12분 걸려 오답, o3 미니는 2분 만에 정답2일 기자가 추론(Reasoning) 기능이 들어간 두 모델을 이용해 2025학년도 수능 수학 영역에서 가장 오답률이 높았던(95.4%) 22번 문제를 풀게 해봤다. 이 문제는 수열 문제로 복잡한 사고와 고난도의 추론 능력이 필요하다고 평가됐다. 먼저 R1의 경우 추론 과정에 무려 12분13초의 시간을 쓰고도 55라는 오답을 제시했다. 추론 과정을 살펴보니 주어진 조건에 일일이 수를 대입해 보는 이른바 '노가다' 방식을 사용했다. 특히 자신이 도출한 답을 신뢰하지 못해 2번 재검토하는 모습을 보여줬다. 반면 'o3 미니 하이'(높은 추론 단계)는 2분13초 만에 문제를 풀며 64라는 정답을 내놨다. 문제풀이 과정을 '수열의 정의' '최종적으로 구해야 할 값' '결론'의 3가지로 나눠 설명했으며, R1의 비해 추론 과정이 체계적으로 보였다. 이전 모델인 o1까지 추론 과정을 공개하지 않던 오픈AI는 o3미니 모델은 일부 추론 과정을 공개하는 방식을 택했다. 2025학년도 수능 국어 독서 영역 문제(1~34번 문제)도 텍스트를 기입하는 방식으로 풀게 해보니 R1은 9개, o3 미니는 8개를 틀렸다. 언어 추론에서 두 모델의 성능이 엇비슷하다고 볼 수 있지만, 저작권 인식에서 차이를 보였다. R1의 경우 저작권과 관련 없이 풀이와 답을 제공한 반면 o3 미니는 문제 전체를 기입할 경우 저작권에 따라 문제를 풀 수 없다고 답변, 일일이 문제를 나눠 입력했다. 한편 두 모델 모두 국어 문제를 프로그래밍 언어로 변환해 입력하면 더 나은 결과를 내놓을 것으로 예상된다. ■"저비용·고효율은 R1이 독보적"고성능 추론을 염두에 두고 만든 o3 미니는 R1을 비롯한 기존 AI 모델들보다 뛰어난 성능을 보였다. 다만 '저비용·고효율' 측면에서는 R1을 무시하기 어렵다는 평가가 나온다. 미국 매사추세츠공과대의 컴퓨터과학자 렉스 프리드먼은 전날 X(옛 트위터)에 "o3 미니는 훌륭한 모델이지만, 딥시크의 R1은 비슷한 성능을 보여주면서 더 저렴하고 추론 과정까지 공개하고 있다"고 전했다. 특히 비용 측면에서 R1의 매력도가 높다. 기업들이 자신의 업무에 AI를 붙여 사용하려면 개발사가 제공하는 애플리케이션프로그래밍인터페이스(API)를 끌어 쓰고 사용료를 낸다. API 사용료를 비교해 보면 R1은 100만개당 입출력 토큰 비용이 각각 0.14달러·2.19달러이지만 o3 미니는 각각 0.55달러·4.40달러로 2배 이상 비싸다. 오픈 AI가 기존 추론 모델 o1에 비해 가격을 93%나 낮췄지만 R1은 비용 부담이 훨씬 적다. 가격만으로는 R1이 완승이다. 다만 보안성과 안정성을 고려하면 얘기는 달라진다. R1은 중국 정부의 검열과 개인정보 유출 문제 등이 제기돼 각국 정부가 규제 움직임을 보이고 있다. wongood@fnnews.com 주원규 기자
2025-02-02 19:22:26한국교육과정평가원(평가원)은 지난 14일 시행된 2025학년도 대학수학능력시험(수능) 문제·정답 가운데 오류가 없었다고 결론을 내렸다. 평가원은 수능 시행 당일인 지난 14일부터 18일 오후 6시까지 총 342건의 이의 신청을 접수했다고 26일 밝혔다. 이 가운데 문제나 정답과 관련 없는 의견 개진, 취소, 중복 등을 제외한 실제 심사 대상은 69개 문항 208건이었다. 영역별로는 국어 영역에서는 14개 문항, 수학 영역에서 4개 문항, 영어 영역에서 6문항 등에 관한 이의 신청이 접수됐다. 탐구 영역에서는 11개 문항과 관련된 이의신청이 제기됐다. 평가원은 외부 전문가가 포함된 이의심사실무위원회의 심사와 이의심사위원회의 최종 심의를 거쳐, 69개 문항 모두에 대해 '문제 및 정답에 이상 없음'으로 판정했다. 윤홍집 기자
2024-11-26 18:26:32[파이낸셜뉴스] 지난 14일 치러진 대학수학능력시험(수능)에 대한 문제·정답 관련 이의신청이 342건 접수됐다. 최상위권 경쟁이 치열할 것으로 예측되는 만큼 정·오답을 가릴 수 있는 이의신청 건수도 전년대비 늘었다. 18일 한국교육과정평가원(평가원)은 오후 6시경 2025학년도 수능 문제 및 정답 이의신청 게시판의 운영을 마치고 접수를 종료했다. 그 결과 이의제기 게시글은 총 342건이 등록됐다. 지난해 수능(288건)보다 54건(18.8%) 늘어난 숫자다. 영역별로는 사회탐구 영역이 124건으로 가장 많았다. 이어 영어 91건, 국어 77건, 과학탐구 31건, 한국사 8건, 수학 7건, 직업탐구와 제2외국어/한문 각각 2건 순이었다. 개별 문항으로 보면 국어 선택과목인 '언어와 매체' 44번과 관련해 가장 많은 42건의 이의신청이 올라왔다. 가상의 학교 축제 홍보를 위한 두 팸플릿을 읽고 적절하지 않은 선택지를 고르는 문제로 복수정답 주장이 제기됐다. 현 시점 평가원 출제본부의 정답은 '각 행사별 진행 절차를 순서도를 통해 보여 주고 있다'(홀수형 기준 1번)이다. 이의 제기 측에서는 '동아리 부스별 활동 내용을 확인할 수 있도록 QR 코드를 제시하고 있다'(홀수형 3번)는 선택지도 정답으로 해석될 여지가 있다고 보고 있다. 지문 내 QR 코드에 대한 설명으로 '부스별 활동 소개 영상'을 제시했지만 구체적인 활동 내용을 확인할 수 있는 지에 대해서는 알 수 없다는 의견이다. 다만 '활동을 소개한다'는 뜻은 활동 내용을 파악할 수 있다는 뜻과 같아 정답이 될 수 없다는 반론도 있다. 이 밖에도 영어 24번(34건), 사회탐구 선택과목 '정치와 법' 20번(19건 이상) 등에서도 다수의 오류 지적이 제기됐다. 문제 뿐 아니라 시험장 환경에 대한 항의도 이어졌다. 영어 영역 게시판의 글 전체 91건 중 최소 36건 이상이 듣기평가에 대한 불만을 토로하는 내용이었다. 수험생으로 추정되는 이용자 다수가 응시한 시험장에 대해 "스피커가 너무 울린다" "소리가 뭉개졌다" "감독관의 기침소리에 거슬려 문제를 풀지 못했다"고 적었다. 2004학년도 시험에서 첫 오류를 인정한 이후 평가원은 이의신청 및 심사 제도를 운영해오고 있다. 최근 5년 간 수능이 끝난 이후 매년 417건, 1014건, 663건, 288건, 342건 등 적지 않은 이의 신청이 접수되고 있다. 과학탐구 생명과학Ⅱ 출제오류 사태가 빚어진 2022학년도 수능 당시엔 1014건이 올라왔다. 2011학년도 수능에는 역대 최다인 1655건이 제기됐고, 가장 적었던 해는 2007학년도 수능의 150건이었다. 평가원은 이날까지 받은 이의신청에 대해 단순 의견 등을 제외한 뒤 19일부터 26일까지 심사를 거쳐 정답을 확정할 예정이다. 심사 결과는 26일 오후 5시 홈페이지를 통해 발표하고 문항과 정답을 최종 확정한다. 최종 정답표를 기반으로 확정된 성적은 다음 달 6일에 수험생들에게 통지될 계획이다. chlee1@fnnews.com 이창훈 기자
2024-11-18 19:54:05입시학원의 사설 모의고사 문제와 유사한 지문이 출제돼 논란이 일었던 수능 영어영역 23번 문항에 대한 이의신청이 받아들여지지 않았다. 지문의 유사성은 이의신청 심사 대상이 아니라는 이유에서다. 수능 출제기관인 한국교육과정평가원(평가원)은 29일 오후 5시 2023학년도 수능 정답 확정 결과를 발표하며 "'문제 및 정답에 이상 없음'으로 판정했다"고 밝혔다. 평가원은 지난 17일부터 21일까지 수능 문제·정답에 대한 이의신청을 받아 총 663건을 접수했다. 이는 지난해 수능 이의신청 건수였던 1014건보다 351건(34.6%) 감소한 수치다. 올해 제기된 이의신청 663건 가운데선 449건이 문제 오류를 검토하거나 정답을 확정하는 데 관련이 없는 것으로 분류됐다. 이들을 제외한 213건이 실제 심사 대상에 올랐고, 이의신청 문항은 총 67개로 나타났다. 이에 따라 입시업체의 사설 모의고사와 흡사한 지문이 출제돼 논란이 일은 영어 23번 문항도 이의신청이 받아들여지지 않았다. 교육부 관계자는 "수능 영어영역 23번 문항 관련 이의 제기 사안은 문항 및 정답 오류에 관한 것이 아니기 때문에 이의신청 심사 대상에 해당하지 않는다"고 밝혔다. 이어 "특정 강사의 사설 모의고사 문항과 동일한 출처의 지문을 활용하고 있으나 지문의 출처만 동일할 뿐 문항 유형이나 선택지 구성이 다르다"고 부연했다. 영어 23번 지문은 지난 2020년 캐스 선스타인 미국 하버드대 로스쿨 교수가 펴낸 'Too Much Information'에서 발췌한 것이다. 이의신청자들은 이 지문이 대형 입시학원에서 제공한 사설 모의고사 지문과 한 문장을 제외하고 동일해 미리 접한 학생에게 유리하다고 주장한 바 있다. 윤홍집 기자
2022-11-29 19:04:46[파이낸셜뉴스] 입시학원의 사설 모의고사 문제와 유사한 지문이 출제돼 논란이 일었던 수능 영어영역 23번 문항에 대한 이의신청이 받아들여지지 않았다. 지문의 유사성은 이의신청 심사 대상이 아니라는 이유에서다. 수능 출제기관인 한국교육과정평가원(평가원)은 29일 오후 5시 2023학년도 수능 정답 확정 결과를 발표하며 "'문제 및 정답에 이상 없음'으로 판정했다"고 밝혔다. 평가원은 지난 17일부터 21일까지 수능 문제·정답에 대한 이의신청을 받아 총 663건을 접수했다. 이는 지난해 수능 이의신청 건수였던 1014건보다 351건(34.6%) 감소한 수치다. 올해 제기된 이의신청 663건 가운데선 449건이 문제 오류를 검토하거나 정답을 확정하는 데 관련이 없는 것으로 분류됐다. 이들을 제외한 213건이 실제 심사 대상에 올랐고, 이의신청 문항은 총 67개로 나타났다. 이에 따라 입시업체의 사설 모의고사와 흡사한 지문이 출제돼 논란이 일은 영어 23번 문항도 이의신청이 받아들여지지 않았다. 교육부 관계자는 "수능 영어영역 23번 문항 관련 이의 제기 사안은 문항 및 정답 오류에 관한 것이 아니기 때문에 이의신청 심사 대상에 해당하지 않는다"고 밝혔다. 이어 "특정 강사의 사설 모의고사 문항과 동일한 출처의 지문을 활용하고 있으나 지문의 출처만 동일할 뿐 문항 유형이나 선택지 구성이 다르다"고 부연했다. 영어 23번 지문은 지난 2020년 캐스 선스타인 미국 하버드대 로스쿨 교수가 펴낸 'Too Much Information'에서 발췌한 것이다. 이의신청자들은 이 지문이 대형 입시학원에서 제공한 사설 모의고사 지문과 한 문장을 제외하고 동일해 사설 모의고사를 미리 접한 학생에게 유리하다고 주장한 바 있다. banaffle@fnnews.com 윤홍집 기자
2022-11-29 15:43:51[파이낸셜뉴스] 국내 한 수학영역 스타강사가 2023학년도 대학수학능력시험(수능) 전날 제자에게 알려준 정답이 실제 수능 정답과 똑같아 화제가 되고 있다. 배성민 대성마이맥 수학영역 강사는 수능 전날인 지난 16일 개인SNS에 응원 메시지를 전하는 영상을 올렸다. 제자들은 “그동안 감사했습니다” “선생님 기 받아서 수능 만점 받겠습니다” 등 감사 댓글을 달았다. 이 가운데 한 제자가 “쌤 22번 뭐로 찍을까요?”라고 물었는데, 이에 배 강사는 “13”이라고 답했다. 수능 시험 직후 해당 게시물에 “놀랍다”는 댓글이 줄줄이 달렸다. 특히 이번 수학영역에서는 22번 문항은 시험 문제 가운데 난이도가 높은 ‘킬러문제’로 꼽혔기 때문에 많은 수험생들이 놀라움을 감추지 못했다. 수학 22번은 함수의 최솟값을 이용해 3차 함수를 추론한 뒤 함숫값을 구하는 문제다. 최상위권에서 변별력을 주는 문제로, 배점도 가장 높은 4점짜리다. 지난 17일 실제 수능 시험에서 수학영역 22번의 정답은 13으로 나와 수험가에서 화제가 되고 있다. 학생들은 “진짜 감사합니다” “처음으로 주관식 공통 다 맞았다” “적중률이란 이런 거다” 등의 반응이 이어졌다. 배 강사도 지난 18일 SNS에 제자들의 댓글들을 캡처한 뒤 “음???? 로또 살 걸”이라며 믿기 힘들다는 반응을 보였다. moon@fnnews.com 문영진 기자
2022-11-20 10:15:30[파이낸셜뉴스] 한 고등학교 교사가 지난해 11월 실시한 대학수학능력시험(수능) 생활과 윤리 과목의 문제 2개가 잘못됐다며 행정소송을 제기했지만 직접적인 이해 당사자가 아니라는 사유로 법원이 받아들이지 않았다. 27일 법조계에 따르면 서울행정법원 행정1부(강동혁 부장판사)는 고등 교사 A씨가 한국교육과정평가원을 상대로 낸 2022학년도 수능 생활과윤리 10번·14번 정답취소소송에서 A씨의 청구를 각하했다. 평가원은 지난해 11월 22일까지 이의신청을 받았고, 생활과 윤리 10번과 14번 문제에 대한 이의신청이 접수됐다. 일주일 뒤 평가원은 "문제와 정답에 이상이 없다"며 해당 문제들의 기존 정답을 확정했다. A씨는 해당 문제들의 오류가 명백하다며 지난해 12월 행정소송을 제기했다. A씨는 생활과 윤리 교사로 문제의 정답을 명확하게 알 필요가 있으므로 자신이 이해 당사자라고 주장했다. 재판부는 "A씨에게 이 사건 처분의 근거 법률에 의해 보호되는 직접적이고 구체적인 이익이 있다고 보기 어려워 처분의 취소를 구할 자격이 존재하지 않는다"며 소송을 각하했다. 이어 "A씨는 수험생이 아니기 때문에 각 문제의 정답이 정정되더라도 자신의 수능 점수가 변경되거나 대학 지원을 위한 조건이 변경되지 않는다"며 "A씨가 생활과 윤리 과목을 가르치는 교사로서 문제 정답을 명확히 할 필요가 있더라도 이는 간접적이고 사실상의 이해관계에 불과하고 고등교육법령 등에서 보호하려는 법률상 이익이라고 볼 수 없다"고 판시했다. koreanbae@fnnews.com 배한글 기자
2022-07-27 14:35:55[파이낸셜뉴스] 올해 대학수학능력시험에서 출제 오류 논란에 휩싸였던 과학탐구 영역 생명과학Ⅱ 20번 문항에 대해 법원이 정답 결정을 취소하는 판결을 내렸다. 이에 수능 출제기관인 한국교육과정평가원(평가원)은 이를 수용하고, 수장인 강태중 원장이 사퇴하기로 했다. 서울행정법원 행정6부(재판장 이주영)는 15일 수능 수험생 92명이 ‘과탐 생명과학Ⅱ 20번 문항의 정답 결정을 취소해달라’며 평가원을 상대로 제기한 소송에서 원고 승소 판결했다. 재판부는 “피고(평가원)가 2022년 11월 수능 생명과학Ⅱ 20번문제의 정답을 5번으로 결정한 처분을 취소한다”면서 “소송비용은 피고가 부담하고 효력정지의 유효기간을 연장하는 결정을 오늘 함께한다”고 밝혔다. 앞서 생명과학Ⅱ 응시자 92명은 출제기관인 평가원을 상대로 20번 문항의 정답 결정을 취소하라며 지난 2일 행정소송을 제기했다. 출제오류 논란을 부른 생명과학Ⅱ 20번은 집단1과 집단2중 하디·바인베르크 평형이 유지되는 집단을 찾고 이를 바탕으로 ‘보기’의 진위를 판단할 수 있는지 평가하는 문항이다. 하지만 주어진 설정에 따라 계산하면 특정 개체 수가 0보다 작은 음수가 나오면서 문항이 오류가 된다는 지적이 쏟아졌다. 문제는 이번 전원 정답처리로 올해 정시·수시에서의 파장이 불가피하다는 점이다. 생명과학Ⅱ는 서울대나 의약학 계열 진학을 희망하는 이과 최상위권 수험생이 주로 응시한다. 서울대 자연계열 정시 전형에 지원하려면 과학탐구Ⅱ 과목을 1개 이상 응시해야 한다. 의약학 계열도 비슷한 제한을 둔 곳이 많다. 입시업계에서는 생명과학Ⅱ 20번 오류로 이를 선택한 학생들의 표준점수가 1점정도 하락하는 등 불이익이 발생할 것으로 예상하고 있다. 올해 이과 상위원에서 수학 고득점자 대거 발생으로 동점자 속출 상황이라는 점에서 과학탐구 변별력이 높아졌기 때문이다. 특히 1~2점으로 갈리는 상위권에서 표준점수 1점 하락으로 인한 수험생들의 혼란이 예상된다. 판결 이후 강태중 평가원장은 이날 정부세종청사에서 브리핑을 갖고 사퇴의사를 밝혔다. . 한편 법원 결정이 나면서 지난 10일 수능 성적 발표일에 점수를 받아보지 못했던 생명과학Ⅱ 응시생들은 이날 오후 6시부터 성적 확인이 가능해진다. leeyb@fnnews.com 이유범 이정화 기자
2021-12-15 15:11:48[파이낸셜뉴스] 2022학년도 대학수학능력시험(수능) 과학탐구 영역 생명과학Ⅱ 20번 문항의 정답 결정을 취소하라는 법원 판단이 나왔다. 서울행정법원 행정6부(이주영 부장판사)는 15일 수험생 등 92명이 한국교육과정평가원(평가원)을 상대로 낸 정답 결정처분 취소 소송 1심에서 수험생들의 손을 들어줬다. 재판부는 "생명과학Ⅱ 20번 문제에 주어진 보기를 가정할 경우, 어느 것이 우선이라는 조건이 성립하지 않거나 음수가 나오는 결과가 발생해 주어진 조건을 모두 만족하는 집단이 없다"며 "문제에 객관적 하자가 있는 경우에 해당한다"고 설명했다. 재판부는 해당 문항에서 모순된 조건이 제시된 것이 수험생들이 답을 선택하는 데 있어 실질적으로 장애가 됐다고 판단했다. 재판부는 "평가원이 제시한 문제 풀이 방식으로 문제를 풀더라도 결국 똑같은 모순을 만나게 된다"며 "수험생 입장에서 이를 쉽게 무시할 수 있으리라 단정하기 어려우며, 통상적으로 제시된 조건이 문제없다는 전제로 자신의 실수라고 생각해 정답 선택에 혼란이 있었을 것"이라고 지적했다. 이어 "시간이 충분하다면 이에 대해 판단할 수 있겠지만, 20문제를 30분 안에 풀어야 하는 상황에서 이를 기대하기 어렵다"며 "결과적으로 평가원이 제시한 방식과 다른 방식으로 문제 풀이를 한 수험생이 불리하게 평가될 수밖에 없는데, 이 수험생들의 추리 분석탐구 능력이 부족하다고 볼 수 없다"고 했다. 재판부는 "이런 상황에서도 정답만을 고집한다면 수험생들은 문제를 파고들수록 불리하며, 평가원 결정은 오류가 있더라도 정정되지 않는다는 교훈으로 남을 것"이라며 "이로 인한 사회적 영향을 고려하더라도 정답 결정을 유지하는 것은 바람직하지 않다"고 지적했다. 논란이 된 생명과학Ⅱ 20번은 집단Ⅰ과 집단Ⅱ 중 하디·바인베르크 평형이 유지되는 집단을 찾고 이를 바탕으로 '보기'의 진위를 판단할 수 있는지 평가하는 문항이다. 하지만 주어진 설정에 따라 계산하면 특정 개체 수가 0보다 작은 음수가 나오면서 문항이 오류라는 지적이 이어졌고, 수험생 92명은 이 문항에 대한 정답 결정 처분을 취소해달라는 본안소송과 함께 정답 결정 효력을 임시로 멈춰달라며 집행정지 신청을 냈다. 앞서 같은 재판부는 지난 9일 "정답 효력이 유지될 경우 회복하기 어려운 손해가 발생할 수 있다"며 해당 문항의 정답 결정 효력을 정답 결정처분 취소 소송 1심 판결이 나올 때까지 정지하도록 했다. 이에 따라 평가원은 지난 10일 생명과학Ⅱ 점수가 공란으로 처리된 성적표를 배부했고, 교육부는 한국대학교육협의회(대교협)와 협의를 거쳐 수시 합격자 발표를 기존 16일에서 18일로 연기했다. clean@fnnews.com 이정화 기자
2021-12-15 15:04:31[파이낸셜뉴스] 2022학년도 대학수학능력시험(수능) 과학탐구 영역 생명과학Ⅱ 20번 문항의 정답 결정을 취소해달라며 수험생들이 낸 소송 1심 결론이 15일로 앞당겨졌다. 14일 법조계에 따르면 서울행정법원 행정6부(이주영 부장판사)는 오는 15일 오후 2시 수험생 등 92명이 한국교육과정평가원(평가원)을 상대로 낸 정답 결정처분 취소 소송 선고기일을 진행한다. 당초 법원은 17일 오후 1시30분에 1심 선고기일을 진행할 예정이었으나, 학사일정 혼란을 최소화하기 위해 선고기일을 앞당긴 것으로 보인다. 앞서 재판부는 17일로 선고기일을 지정하면서 "사정이 허락하면 선고기일을 최대한 앞당기겠다"고 한 바 있다. 논란이 된 생명과학Ⅱ 20번은 집단Ⅰ과 집단Ⅱ 중 하디·바인베르크 평형이 유지되는 집단을 찾고 이를 바탕으로 '보기'의 진위를 판단할 수 있는지 평가하는 문항이다. 하지만 주어진 설정에 따라 계산하면 특정 개체 수가 0보다 작은 음수가 나오면서 문항이 오류라는 지적이 이어졌고, 수험생 92명은 이 문항에 대한 정답 결정 처분을 취소해달라는 본안소송과 함께 정답 결정 효력을 임시로 멈춰달라며 집행정지 신청을 냈다. 앞서 같은 재판부는 지난 9일 "정답 효력이 유지될 경우 회복하기 어려운 손해가 발생할 수 있다"며 해당 문항의 정답 결정 효력을 정답 결정처분 취소 소송 1심 판결이 나올 때까지 정지하도록 했다. 이에 따라 평가원은 지난 10일 생명과학Ⅱ 점수가 공란으로 처리된 성적표를 배부했고, 교육부는 한국대학교육협의회(대교협)와 협의를 거쳐 수시 합격자 발표를 기존 16일에서 18일로 연기했다. clean@fnnews.com 이정화 기자
2021-12-14 18:02:48