딥시크발 추론AI 열풍에 韓뒤질라…LG 이어 업스테이지 공개임박

연합뉴스 2025-03-23 08:00:02

하반기 공개 예정…'엑사원 딥' 이은 두번째 AI추론 모델 주목

업스테이지 '솔라'

(서울=연합뉴스) 김현수 기자 = 딥시크가 촉발한 AI 추론 모델 경쟁에서 국내 기업들도 점차 기지개를 켜고 있다.

23일 ICT업계에 따르면 AI 스타트업 업스테이지는 개발 중인 추론형 AI 모델을 하반기 공개할 예정이다.

추론에 특화된 국내 AI 모델은 지난 18일 공개된 LG AI연구원의 '엑사원 딥'이 유일하다.

추론 모델은 AI가 데이터에 기반해 단순히 결론을 도출하는 기존 모델과 달리, '생각의 고리'(CoT)를 활용해 최적의 해결책을 찾는 기능(Reasoning)이 특징이다.

오픈AI 'o 시리즈', 딥시크 R1 등이 대표적인 AI 추론 모델이다. 마이크로소프트(MS)도 자체 추론 모델을 개발 중이다.

AI 추론 모델은 스스로 가설을 세우고 이를 검증할 수 있어 수학·과학·코딩 등 전문 연구 및 교육 현장에서 활용도가 높을 것으로 전망된다.

업스테이지가 개발 중인 AI 추론 모델은 업스테이지의 거대언어모델(LLM) '솔라'와 마찬가지로 경량화 모델로 공개될 전망이다.

업스테이지 관계자는 "최근 추론형 AI 모델의 추세는 크기를 작게 만드는 것"이라며 "(업스테이지 추론 모델의) 파라미터(매개변수)가 정해지진 않았지만 400억개 미만일 것으로 예상된다"고 전했다.

엑사원 딥 기본 모델의 매개변수는 320억개다.

매개변수가 많을수록 고도화된 AI 훈련이 가능하다. 딥시크 R1의 매개변수는 6천710억개, 구글 '제미나이 울트라'의 매개변수는 1조5천600억개에 달한다.

다만, 그만큼 많은 연산 자원이 필요하고, 추론 시간이 지연될 가능성도 있다.

매개변수가 적은 모델이 성능 면에서 우수한 성과를 내는 사례도 생겨난다.

업스테이지의 솔라는 2023년 12월 글로벌 오픈소스 플랫폼 허깅 페이스의 LLM 평가(오픈 LLM 리더보드)에서 74.2점을 기록, 알리바바의 '큐원'을 제치고 세계 1위를 차지했다.

솔라의 매개변수는 107억개로, 큐원 대비 6분의 1 이상 작다.

이 같은 경량화 모델은 비용 절감 효과가 크고 내부 서버에서 설치·운영이 가능해 개별 기업의 '프라이빗 AI' 등으로 활용성이 높다는 게 업스테이지의 설명이다.

한편, 올해 초 딥시크가 R1으로 '저비용·고성능' 추론 모델의 가능성을 증명함에 따라, 향후 AI 기업들이 자체 추론 모델을 개발하려는 시도는 가속화될 전망이다.

네이버는 지난 달 공개한 하이파클로바X 신모델을 기반으로 추론에 특화된 AI 모델을 개발 중이다.

hyunsu@yna.co.kr