과학기술정보통신부는 코로나 이후 경제 상황에 대비해 2000개 비대면 일자리 창출을 목표로 대규모 과학기술 기계학습 데이터 구축사업을 시작한다.
과학기술정보통신부는 인공지능(AI) 기반의 디지털 뉴딜 사업의 일환으로 한국과학기술정보연구원(이하 KISTI)이 축적해 온 논문 등을 대상으로 이 같은 사업을 시작한다고 24일 밝혔다.
이 사업은 재택근무를 통해 비대면으로 진행되며 만 19세에서 34세 이하의 청년층을 대상으로 이달 25일부터 8월 10일까지 1차 모집, 올해 12월까지 시행될 예정이다.
청년층 또는 취업취약계층을 우선적으로 선발하고 직무교육을 통해 인공지능(AI) 디지털 역량과 기계학습 데이터 구축 기술을 습득한 인력으로 육성하는 데 의의가 있다.
대규모 과학기술 공공데이터를 구축하게 되면 KISTI의 ScienceON(과학기술 지식인프라 연계 융합서비스)에서 인공지능(AI) 서비스운영을 통해 수요자에게 제공한다.
국내논문과 국가R&D보고서 원문을 대상으로 과학기술분야 기계학습 데이터 5종을 구축하며 최대 425만여 건의 과학기술 기계학습 데이터가 사업물량이다.
데이터 구축은 코로나19 상황이므로 온라인 시스템을 활용, 비대면으로 진행하되 데이터 품질 부실화를 방지하기 위해 크라우드소싱 기반 검증 방식을 적용한다.
이번 사업을 통해 교육 받은 인력들은 앞으로도 과학기술분야 기계학습 데이터 레이블링 전문 인력으로 양성, 지속적인 기계학습 데이터 구축 역량을 계발할 수 있도록 함으로써 데이터 산업 수요에 부응할 예정이다.
텍스트, 영상, 음성 등 다양한 분야의 데이터 레이블러 수요 증가에 따라 데이터 수집·가공 관련 기업에서의 활발한 활용이 예상된다.
과학기술분야 기계학습 데이터가 구축·개방 되면 과학기술분야 지식자원의 지능적 연계 및 융합연구 지원과 중소기업 기술혁신을 위한 의사결정 및 비즈니스 활용이 가능해질 것으로 예상된다.
이 사업을 통해 구축된 과학기술분야 기계학습 데이터는 과학기술분야 언어이해 모델개발에 활용될 예정이며 과학기술분야 자연어 처리 문제 해결을 위한 초석이 마련된다.
권석민 과기정통부 과학기술일자리혁신관은 “이번 기계학습을 위한 데이터 구축은 학술정보에 대한 접근성을 향상시켜 4차 산업혁명 시대의 근간인 D.N.A(데이터/Data·네트워크/Network·인공지능/AI)를 위한 데이터댐 건설에 주춧돌이 될 것”이라고 말했다.
이번 과학기술 기계학습 데이터 구축사업에 관한 자세한 내용은 KISTI 일자리혁신사업지원팀(042-869-1674) 또는 이달 25일부터 KISTI 온라인 지원 홈페이지(https://kisti.recruiter.co.kr)를 통해 안내 받을 수 있다.
문의: 과학기술정보통신부 연구기관지원팀 044-202-4753
<자료출처=정책브리핑 www.korea.kr>