국산 AI 반도체로 추론 인프라 비용 부담 완화

(서울=연합뉴스) 권하영 기자 = 가비아[079940]는 국내 인공지능(AI) 반도체 기업 리벨리온의 신경망처리장치(NPU)인 '아톰맥스'를 기반으로 한 클라우드 서비스 'NPUaaS'를 출시했다고 9일 밝혔다.
NPUaaS는 NPU 인프라를 클라우드 방식으로 구독해 사용하는 서비스다. NPU는 학습된 AI 모델을 실제 서비스에 적용하는 추론 작업에 특화된 반도체로, GPU 대비 전력 소모가 적고 비용 효율이 높아 GPU 의존도를 낮추려는 기업의 대안으로 주목받고 있다.
인스턴스(VM) 기반으로 출시된 가비아의 NPUaaS는 운영체제(OS) 커널 수준의 세밀한 환경 설정과 커스터마이징이 가능하다. 특정 AI 워크로드 요건에 맞는 정밀한 인프라 구성을 지원하며, 서비스 목적에 따라 유연하게 확장할 수 있다는 설명이다.
가비아 NPUaaS에서 활용 가능한 아톰 맥스는 1장 기준 128테라플롭스(TFLOPS)의 연산 성능과 64기가바이트(GB)의 NPU 메모리를 제공한다.
서비스 출시에 맞춰 가비아는 도입 검토 기업을 대상으로 'AI 추론 프레임워크 최적화 컨설팅'을 함께 제공하며, 고객사 특성에 따른 맞춤형 기술 지원도 병행한다.
정대원 가비아 상무는 "AI 서비스의 경쟁력은 모델 성능만큼이나 추론 환경의 효율성에 달려 있다"며 "NPUaaS와 전문 컨설팅을 결합해 기업이 인프라 부담 없이 AI 비즈니스에 집중할 수 있는 환경을 만들겠다"고 말했다.
kwonhy@yna.co.kr











