보도자료

인공지능 학습용 데이터 개방, 2배(191→381종)로 늘어난다

작성자 : 관리자 작성일 : 2022-07-13

 

 

인공지능 학습용 데이터 개방, 2(191381)로 늘어난다

- 7.12()부터 자율주행건강관리 등 6대 분야 190종을 인공지능 허브(aihub.or.kr)에 추가 개방 -

- ··연  인공지능 전문가가 참여하는 인공지능 데이터 활용협의회를 통해 데이터 활용 확산 논의 -

박윤규 제2차관인공지능 학습용 데이터로 개발한 상품 자동인식·결제 기기 시연 참관 -

 

 

 

 과학기술정보통신부(장관 이종호, 이하 ‘과기정통부’)는 국내 인공지능 기술과 산업 발전을 견인할 인공지능 학습용 데이터 190(5.8억건)을 인공지능 허브(aihub.or.kr)를 통해 7월 12일부터 추가 개방한다고 밝혔다.

 

  ○ 과기정통부는 ’17년부터 기업연구자 등이 시간·비용 문제 등으로 개별 확보하기 어려운 인공지능 학습용 데이터를 구축·개방해 왔고20부터 구축 규모를 대폭 늘린 후 18만건 이상의 다운로드를 기록 중이다.

 

  ○ 이번 데이터 개방은 지난해 6월 개방한 20 구축 데이터 170(4.8억건)에 더하여 21년 구축한 190에 대한 품질·활용성 검증 거쳐 순차적으로 개방하는 것으로총 규모는 381에 달하게 된다.

 

□ 아울러이번 데이터 개방과 함께 산··연 각 계 전문가가 인공지능 허브(AI Hub) 데이터 활용 촉진과 성과 확산 방안을 논의하는 ‘3회 인공지능 데이터 활용협의회’를 박윤규 과기정통부 2차관 주재로 개최하였다.

 

    ※ 인공지능 데이터 활용협의회 민관 협력을 통한 인공지능 허브 데이터 활용 활성화 및 성과 창출을 목적으로 출범(‘21.6.18.), 제2회 협의회 개최(’21.11.3.)

 

  ○ 박윤규 차관은 이 날 협의회에 앞서 인공지능 허브(AI Hub) 개방된 데이터를 활용하여 개발한 인공지능 상품인식·결제 및 보안 서비스, CES 2022 혁신상을 수상한 인피닉사의 ‘인공지능 카운터’ 시연 참관하였다.

 

 

1

 

올해 추가 개방되는 인공지능 학습용 데이터(190) 주요 특징

 

 

 

 

 

□ 이번에 개방되는 6대 분야 190*의 인공지능 학습용 데이터는 기획부터 구축까지 산업계전문가와 국민이 대거 참여한 결과물로,

 

    한국어 음성·자연어(아동다화자 음성 등 44)영상·이미지(스포츠 동작반려동물 등 39), 교통·물류(로봇주행교통사고 등 22)헬스케어(심장질환정신건강 등 32)재난·안전·환경(과적차량, 물류창고 등 27종), 농·축·수산(정밀 농업, 스마트 양식 등 26종)

 

  ○ 민간 수요를 바탕으로 분야별 ··연 전문가데이터 활용기업 등이 직접 참여하여 산업 파급효과가 크고 민간에서 대규모로 구축하기 어려운 데이터들을 발굴·선정하는 방식으로 기획되었다.

 

  ○ 특히데이터 구축 과정에 국내 주요 인공지능·데이터 전문기업은 물론 대학(서울대, KAIST 등 118)병원(서울대병원국립암센터 등 50) 등 총 811개 기업·기관과 4만 3천여명에 이르는 국민이 참여하였다.

 

□ 또한, 정보통신기술 표준화·인증을 수행하는 한국정보통신기술협회(TTA)의 전문적 품질검증과 함께 실제 데이터 수요자가 요구하는 품질 수준 확보하기 위하여,

 

  ○ 주요 대기업(네이버·카카오·LG·KT·현대차 등)스타트업(라이드플럭스·스트라드비젼 등)대학 및 연구기관(GIST·부산대·ETRI·한국자동차연구원 등)의 데이터 활용성 검토와 추가 보완을 거쳤다.

 

 

< ‘22년 추가개방 인공지능 학습용 데이터 활용성 검토 주요 결과 >

 

 ■ 다양한 출처의 대규모 한국어 데이터가 수집되어 기존 서비스 개선에 활용 기대”(대기업 A)

 

 ■ 인공지능 챗봇 및 인공지능 콜센터 등 높은 정확도를 요구하는 한국어 패턴 발화에 대한 인식성능 개선 기대”(대기업 B사, 중소기업 C사)

 

 ■ “자체 구축이 어려운 다양한 기상상황, 조도환경 및 촬영시점 등을 고려한 데이터가 구축되어 활용도가 높을 것으로 예상”(스타트업 D사, E대학)

 

 

□ 과기정통부와 한국지능정보사회진흥원(이하‘지능정보원) 데이터 개방 후에도 인공지능 허브(AI Hub) 내 품질 의견수렴 상시창구 운영한국정보과학회와 연계한 데이터 품질개선 연구 지원(7~12) 등 · 협력 통하여 데이터 품질과 활용성을 지속 관리·개선해나갈 계획이다.

 

 

2

 

 제3회 인공지능 데이터 활용협의회 개최

 

 

 

 

 

□ 과기정통부는 인공지능 학습용 데이터 추가 개방과 함께인공지능 허브(AI Hub) 데이터 활용 촉진과 성과 확산 방안을 논의하는 ‘제3 인공지능 데이터 활용협의회’ 열어 인공지능·데이터 산업·연구현장 생생한 의견을 수렴하였다.

 

  ○ 이날 협의회에는 인공지능 서비스를 직접 개발‧활용하고 있는 주요 대기업중소·스타트업과 유관기관 등 14개 기업·기관* 관계자가 참석하였다.

 

      * 대기업(KT, 네이버클로바, 현대자동차 에어스컴퍼니, 카카오엔터프라이즈), 중소‧스타트업(인피닉에이아이포펫딥노이드포티투마루)유관기관 등(한국자동자연구원한국과학기술연구원한국환경연구원광주과학기술원한국지능정보사회진흥원, 한국정보통신기술협회)

 

 우선 과기정통부와 지능정보원은 인공지능 학습용 데이터 구축·활용 주요 성과*와 인공지능 허브(AI Hub) 기능 개선사항** 등을 공유하고, 인공지능 허브(AI Hub) 데이터 이용 활성화를 위한 지원 방안 등을 제시하였다.

 

      * 누적 다운로드 18만건(21)서비스 개발·확산 등 143특허출원 및 등록 65연구실적 79건 등
자세한 사항은 “[붙임4] 인공지능 학습용 데이터 활용현황 및 주요 성과”를 참조

 

     ** 데이터 객체 검색 기능 도입, UI/UX 개선, 전문 시스템 모니터링 도구 도입 등

 

  ○ 이어진 민간의 인공지능 허브(AI Hub) 데이터 활용 우수사례 발표에서는 KT의 다양한 한국어 음성 데이터를 활용한 콜센터 상담 내용 분류 및 요약 성능 향상 사례와 더불어,

 

  ○ 에이아이포펫의 인공지능 허브(AI Hub) 반려동물 안구질환 이미지 데이터’를 활용한 반려동물 질병 판독 서비스 티티케어(TTcare)’ 개발 사례(CES 2022 혁신상 수상)가 소개되었다.

 

 

 

 참석자들은 계속되는 간담회를 통해 인공지능 산업·연구·교육 등 다양한 현장에서 인공지능 허브(AI Hub) 데이터 활용을 더욱 촉진할 수 있는 각종 정책지원 방안 등에 대하여 가감 없이 의견을 나누었다.

 

  ○ 이 날 협의회를 주재한 박윤규 차관은 “우리 데이터로 우리 기업 개발한 서비스가 세계적으로 인정받고 있다는 점이 자랑스럽기도 하지만, 동시에 막중한 책임감을 느끼고 있다”며,

 

  ○ “앞으로도 다양한 분야에서 의미 있는 활용성과가 나타날 수 있도록 데이터의 양적·질적 가치를 계속해서 높여가나는 것이 협의회를 통해 모색할 중요한 과제”라 언급했다.

 

□ 또한“정부도 앞으로 인공지능 허브(AI Hub) 데이터가 대한민국 디지털 전환 선도하는 중요한 밑거름이 될 수 있도록 계속 노력하겠다”면서, 국내 인공지능·데이터 생태계의 성장과 경쟁력 제고를 위하여 협의회 중심으로 ·이 적극 협력해나갈 것을 당부하였다.