TAPTALK

수학 추론 능력 평가서 GPT-4o 앞서

(서울=연합뉴스) 김경희 기자 = 원라인에이아이는 21일 추론 특화 한국어 인공지능(AI) 모델 '올라프 v2'를 공개했다.

해당 모델은 오픈AI의 핵심 기술인 생각 프로세스와 테스트 시간 스케일링을 기반으로 개발됐다.

생각 프로세스는 AI 언어모델의 새로운 추론 방식으로 주어진 문제를 스스로 이해하고 해결 방안을 제시하는 사고 과정을 생성하며, 테스트 시간 스케일링은 다양한 전략을 시뮬레이션해 최적 설루션에 도달하도록 돕는다.

회사 측은 올라프 v2의 추론 능력을 평가한 결과 초중등 수학 문제 모음에서 91.96점, 올림피아드급 문제 모음에선 36.20점을 기록했다고 밝혔다.

이는 오픈AI의 GPT-4o가 각각 영역에서 91.21점, 30.75점을 맞은 것과 비교해 더 우수한 점수라고 회사 측은 강조했다.

정한얼 원라인에이아이 대표는 "올라프 v2가 보여준 뛰어난 추론 능력은 복잡한 금융 데이터 분석과 리스크 평가에 특히 강점을 보일 것"이라며 "현재 국내 주요 금융사들과 진행 중인 프로젝트를 통해 금융권 특화 서비스로 발전시켜 나갈 계획"이라고 말했다.

kyunghee@yna.co.kr