인공지능 학습용 데이터 개방, 2배(191→381종)로 늘어난다 |
- 7.12(화)부터 자율주행, 건강관리 등 6대 분야 190종을 인공지능 허브(aihub.or.kr)에 추가 개방 - - 산·학·연 인공지능 전문가가 참여하는 인공지능 데이터 활용협의회를 통해 데이터 활용 확산 논의 - - 박윤규 제2차관, 인공지능 학습용 데이터로 개발한 상품 자동인식·결제 기기 시연 참관 - |
□ 과학기술정보통신부(장관 이종호, 이하 ‘과기정통부’)는 국내 인공지능 기술과 산업 발전을 견인할 인공지능 학습용 데이터 190종(5.8억건)을 인공지능 허브(aihub.or.kr)를 통해 7월 12일부터 추가 개방한다고 밝혔다.
○ 과기정통부는 ’17년부터 기업, 연구자 등이 시간·비용 문제 등으로 개별 확보하기 어려운 인공지능 학습용 데이터를 구축·개방해 왔고, ’20년부터 구축 규모를 대폭 늘린 후 18만건 이상의 다운로드를 기록 중이다.
○ 이번 데이터 개방은 지난해 6월 개방한 ’20년 구축 데이터 170종(4.8억건)에 더하여 ’21년 구축한 190종에 대한 품질·활용성 검증을 거쳐 순차적으로 개방하는 것으로, 총 규모는 381종에 달하게 된다.
□ 아울러, 이번 데이터 개방과 함께 산·학·연 각 계 전문가가 인공지능 허브(AI Hub) 데이터 활용 촉진과 성과 확산 방안을 논의하는 ‘제3회 인공지능 데이터 활용협의회’를 박윤규 과기정통부 2차관 주재로 개최하였다.
※ 인공지능 데이터 활용협의회 : 민관 협력을 통한 인공지능 허브 데이터 활용 활성화 및 성과 창출을 목적으로 출범(‘21.6.18.), 제2회 협의회 개최(’21.11.3.)
○ 박윤규 차관은 이 날 협의회에 앞서 인공지능 허브(AI Hub)에 개방된 데이터를 활용하여 개발한 인공지능 상품인식·결제 및 보안 서비스로, CES 2022 혁신상을 수상한 인피닉사의 ‘인공지능 카운터’ 시연도 참관하였다.
1 |
| 올해 추가 개방되는 인공지능 학습용 데이터(190종) 주요 특징 |
|
|
□ 이번에 개방되는 6대 분야 190종*의 인공지능 학습용 데이터는 기획부터 구축까지 산업계, 전문가와 국민이 대거 참여한 결과물로,
* 한국어 음성·자연어(아동, 다화자 음성 등 44종), 영상·이미지(스포츠 동작, 반려동물 등 39종), 교통·물류(로봇주행, 교통사고 등 22종), 헬스케어(심장질환, 정신건강 등 32종), 재난·안전·환경(과적차량, 물류창고 등 27종), 농·축·수산(정밀 농업, 스마트 양식 등 26종)
○ 민간 수요를 바탕으로 분야별 산·학·연 전문가, 데이터 활용기업 등이 직접 참여하여 산업 파급효과가 크고 민간에서 대규모로 구축하기 어려운 데이터들을 발굴·선정하는 방식으로 기획되었다.
○ 특히, 데이터 구축 과정에 국내 주요 인공지능·데이터 전문기업은 물론 대학(서울대, KAIST 등 118개), 병원(서울대병원, 국립암센터 등 50개) 등 총 811개 기업·기관과 4만 3천여명에 이르는 국민이 참여하였다.
□ 또한, 정보통신기술 표준화·인증을 수행하는 한국정보통신기술협회(TTA)의 전문적 품질검증과 함께 실제 데이터 수요자가 요구하는 품질 수준을 확보하기 위하여,
○ 주요 대기업(네이버·카카오·LG·KT·현대차 등), 스타트업(라이드플럭스·스트라드비젼 등), 대학 및 연구기관(GIST·부산대·ETRI·한국자동차연구원 등)의 데이터 활용성 검토와 추가 보완을 거쳤다.
< ‘22년 추가개방 인공지능 학습용 데이터 활용성 검토 주요 결과 >
■ “다양한 출처의 대규모 한국어 데이터가 수집되어 기존 서비스 개선에 활용 기대”(대기업 A사)
■ “인공지능 챗봇 및 인공지능 콜센터 등 높은 정확도를 요구하는 한국어 패턴 발화에 대한 인식성능 개선 기대”(대기업 B사, 중소기업 C사)
■ “자체 구축이 어려운 다양한 기상상황, 조도환경 및 촬영시점 등을 고려한 데이터가 구축되어 활용도가 높을 것으로 예상”(스타트업 D사, E대학) |
□ 과기정통부와 한국지능정보사회진흥원(이하, ‘지능정보원)은 데이터 개방 후에도 인공지능 허브(AI Hub) 내 품질 의견수렴 상시창구 운영, 한국정보과학회와 연계한 데이터 품질개선 연구 지원(7~12월) 등 민·관 협력을 통하여 데이터 품질과 활용성을 지속 관리·개선해나갈 계획이다.
2 |
| 제3회 인공지능 데이터 활용협의회 개최 |
|
|
□ 과기정통부는 인공지능 학습용 데이터 추가 개방과 함께, 인공지능 허브(AI Hub) 데이터 활용 촉진과 성과 확산 방안을 논의하는 ‘제3회 인공지능 데이터 활용협의회’를 열어 인공지능·데이터 산업·연구현장의 생생한 의견을 수렴하였다.
○ 이날 협의회에는 인공지능 서비스를 직접 개발‧활용하고 있는 주요 대기업, 중소·스타트업과 유관기관 등 14개 기업·기관* 관계자가 참석하였다.
* 대기업(KT, 네이버클로바, 현대자동차 에어스컴퍼니, 카카오엔터프라이즈), 중소‧스타트업(인피닉, 에이아이포펫, 딥노이드, 포티투마루), 유관기관 등(한국자동자연구원, 한국과학기술연구원, 한국환경연구원, 광주과학기술원, 한국지능정보사회진흥원, 한국정보통신기술협회)
□ 우선 과기정통부와 지능정보원은 인공지능 학습용 데이터 구축·활용 주요 성과*와 인공지능 허브(AI Hub) 기능 개선사항** 등을 공유하고, 인공지능 허브(AI Hub) 데이터 이용 활성화를 위한 지원 방안 등을 제시하였다.
* 누적 다운로드 18만건, (‘21년)서비스 개발·확산 등 143건, 특허출원 및 등록 65건, 연구실적 79건 등
자세한 사항은 “[붙임4] 인공지능 학습용 데이터 활용현황 및 주요 성과”를 참조
** 데이터 객체 검색 기능 도입, UI/UX 개선, 전문 시스템 모니터링 도구 도입 등
○ 이어진 민간의 인공지능 허브(AI Hub) 데이터 활용 우수사례 발표에서는 KT의 다양한 한국어 음성 데이터를 활용한 콜센터 상담 내용 분류 및 요약 성능 향상 사례와 더불어,
○ 에이아이포펫의 인공지능 허브(AI Hub) ‘반려동물 안구질환 이미지 데이터’를 활용한 반려동물 질병 판독 서비스 ‘티티케어(TTcare)’ 개발 사례(CES 2022 혁신상 수상)가 소개되었다.
□ 참석자들은 계속되는 간담회를 통해 인공지능 산업·연구·교육 등 다양한 현장에서 인공지능 허브(AI Hub) 데이터 활용을 더욱 촉진할 수 있는 각종 정책지원 방안 등에 대하여 가감 없이 의견을 나누었다.
○ 이 날 협의회를 주재한 박윤규 차관은 “우리 데이터로 우리 기업이 개발한 서비스가 세계적으로 인정받고 있다는 점이 자랑스럽기도 하지만, 동시에 막중한 책임감을 느끼고 있다”며,
○ “앞으로도 다양한 분야에서 의미 있는 활용성과가 나타날 수 있도록 데이터의 양적·질적 가치를 계속해서 높여가나는 것이 협의회를 통해 모색할 중요한 과제”라 언급했다.
□ 또한, “정부도 앞으로 인공지능 허브(AI Hub) 데이터가 대한민국의 디지털 전환을 선도하는 중요한 밑거름이 될 수 있도록 계속 노력하겠다”면서, 국내 인공지능·데이터 생태계의 성장과 경쟁력 제고를 위하여 협의회를 중심으로 민·관이 적극 협력해나갈 것을 당부하였다.