인공지능 산업 성장의 촉진제인 인공지능(AI) 학습용 데이터 공급 확대
- 작년보다 2배 늘어난 390억원을 투입하여 20종류, 6천만건 구축·개방 -
□ 과학기술정보통신부(장관 최기영, 이하 ‘과기정통부’)는 인공지능(AI) 개발에 필수적인 양질의 AI 데이터를 대규모로 구축·개방하는 AI 학습용 데이터 사업 공모를 3월 20일(금)부터 시작한다고 밝혔다.
□ 동 사업은 3년간 총 65개 기업, 1,818명이 참여하여, ’17년 4종 750만 건, ’18년 7종 1,100만 건, ’19년 10종 2,800만 건 등 총 21종 4,650만 건의 AI 학습 데이터를 구축․개방하였다.
ㅇ 이를 통해 4,400여 명 개발자가 17,077회를 활용하여 AI 서비스․제품개발에 박차를 가해왔다.
□ 올해는 작년보다 예산 및 과제가 2배 늘어난 20개 과제(10개 지정 공모, 10개 자유 공모)를 390억 원 규모(’19년 195억 원)로 공모한다.
ㅇ 해외 및 전문가 수요조사, 데이터 가치평가 등을 통해 기술·산업적으로 활용 가치가 높은 AI 학습용 데이터 10종에 대해서 지정 공모하고,
ㅇ 감염병 등 최근 수요의 적시 대응과 데이터 3법 개정 후 가명정보 활용과 관련한 시장 수요를 반영하는 한편, 의료, 금융분야 등 주요 정부정책과도 연계하기 위해 10종은 자유 공모로 추진한다.
ㅇ 또한, 주관기관을 데이터기업에서 AI전문기업으로 변경하여 실질 수요 기반 데이터를 구축함에 따라, 이를 활용한 혁신 AI서비스․제품을 빠른 시간 안에 생산하여 상용화로 이어질 수 있을 것으로 기대된다.
< 사업주관기업 변경안 >
구분 | 기존 | ▶ | 변경(안) |
주관 | (데이터 가공기업) 범용성을 고려하여 데이터 형식, 규격, 속성 정보 등을 가공 | (AI 전문기업) 제품과 성능에 중점을 둔 데이터를 설계하여 고성능 서비스 개발 | |
참여 | (AI 전문기업) 구축된 데이터 셋을 제공 받아 AI 시범 서비스 개발 | (데이터 가공기업) 설계 요구안에 최적화된 데이터셋 가공 및 제공 후 대외 공개 |
□ AI 학습용 데이터 구축 사업 개요
ㅇ (공모 분야) 중점데이터 구축(10종)과 혁신적인 시장 수요기반의 데이터 구축(10종) ㅇ (지원 자격) 인공지능 학습용 데이터를 구축·개방하고자 하는 기업, 협회, 출연연, 공공기관, 대학 등 민간·공공 법인 등 제한 없이 참여 가능 ㅇ (선정 방안) 참여기업·기관이 컨소시엄을 구성하여 신청하고 공모를 거쳐 선정 ㅇ (평가 절차) 산‧학‧연 AI 전문가 등으로 평가위원회를 구성하여 선정 ㅇ (소요 예산) ’20년 390억 원(사업당 20억 원 이내) |
□ 올해부터 크라우드소싱* 방식을 도입하는 기업과 사회적 약자를 지원하는 기업을 우대하는 등 국민 참여형 AI 학습 데이터를 구축하고 AI Hub**에 개방할 예정이다.
* 크라우드소싱 : 언제 어디서든 누구나 데이터 수집 및 가공에 참여하는 방식
** AI 개발 필수 인프라(데이터, API, 컴퓨팅 자원 등)를 지원하는 통합 플랫폼(www.aihub.or.kr)
ㅇ 크라우드소싱 방식은 청년, 취업준비자, 경력단절여성 등에게 일자리 제공이 가능하고 데이터 가공 전문 인력 양성에도 기여할 것으로 기대된다.
ㅇ 또한, 장애인, 사회적 약자 등이 데이터 가공에 적극 참여할 수 있게 하여 사회적 가치를 실현할 수 있을 것으로 보인다.
□ 동 사업에 대한 공모관련 자료 등은 한국정보화진흥원 홈페이지(https://www.nia.or.kr) 내 입찰 공고란에 공지된다.
□ 과기정통부는 앞으로 “국내 특성에 맞는 인공지능 학습용 데이터 구축을 확대하여 다양한 인공지능 기술개발을 가속화하는 추동력을 확보할 계획”이며,
ㅇ “AI 산업 생태계 조성과 글로벌 경쟁력 강화를 위해 지속적인 정책 지원을 해 나갈 것”이라고 밝혔다.