10일부터 범부처 AI 학습용데이터 현황조사 실시

(서울=연합뉴스) 권하영 기자 = 정부가 각 부처와 공공기관이 보유한 인공지능(AI) 학습용 데이터의 현황을 파악하고 고품질 데이터 확보를 위한 첫 전수조사에 나선다.
과학기술정보통신부는 한국지능정보사회진흥원과 함께 범부처 'AI 학습용데이터 현황조사(AI 학습용데이터 센서스)'를 10일부터 실시한다고 밝혔다.
생성형 AI 확산에 따라 고품질 데이터 확보가 핵심 경쟁력으로 떠올랐으나, 현재 공공기관 데이터는 기관별로 분산 관리돼 종합적인 파악과 기업들의 활용에 한계가 있었다.
이에 과기정통부는 AI기본법 제15조에 근거해 전 부처를 대상으로 첫 전수조사를 실시하며, 각 기관의 데이터 현황을 체계적으로 진단해 활용 가능성을 파악할 방침이다.
이번 센서스는 AI 학습용 데이터뿐 아니라 향후 가공을 통해 활용 가능한 데이터까지 포함하며, 데이터의 유형과 구조, 구축 목적, 제공 가능 범위 등 활용 가능성과 직결되는 요소를 조사한다.
과기정통부는 조사 결과를 토대로 전문가 심층 인터뷰와 민간 수요조사를 거쳐 AI 학습 활용 가능성이 높은 데이터 100종을 최종 선정할 계획이다.
선정된 100종의 데이터는 60억원 규모의 예산을 투입해 품질 보완과 비식별조치 등 기술적·재정적 지원을 거쳐 'AI 학습용데이터 통합제공체계'를 통해 제공된다.
온라인 공개가 어려운 데이터는 보안 대책이 갖춰진 시설에서 안전하게 분석할 수 있는 '데이터 안심구역'을 통해 병행 제공할 예정이다.
아울러 과기정통부는 기존 AI허브를 통합제공체계로 고도화해 공공과 민간의 데이터를 통합 관리하고, 데이터 발굴부터 활용까지 이어지는 선순환 구조를 조성한다.
김경만 과기정통부 인공지능정책실장은 "AI 성능과 품질의 핵심은 활용 가능한 풍부한 데이터에 있다"며 "공공부문 데이터 자산을 체계적으로 발굴해 편리하게 활용할 수 있는 기반을 지속 발전시키겠다"고 말했다.
kwonhy@yna.co.kr











