| |||
’22년 인공지능 학습용 데이터 구축 사업 공모,
- 한국어, 자율주행 등 250종 지정과제와 지역·자유과제 60종 공모
- 1월 지정과제 120종을 시작으로 3월까지 3회에 걸쳐 순차적 공모 |
□ 과학기술정보통신부(장관 임혜숙, 이하 ‘과기정통부’)는 인공지능(AI) 개발에 필수적인 양질의 인공지능 학습용 데이터를 대규모로 구축·개방하는 ‘인공지능 학습용 데이터 구축사업’의 ’22년도 사업 공모(310종, 5,797억원)를 1월 21일(금)부터 시작한다고 밝혔다.
ㅇ 동 사업은 기업, 연구자, 개인 등이 시간 및 비용 문제*로 개별 구축하기 어려운 인공지능 학습용 데이터를 대규모로(’25년까지 1,300여종) 구축하여 AI허브(www.aihub.or.kr)를 통해 개방하는 사업으로,
* 인공지능 학습용 데이터 구축 과정(수집·가공·검수)은 대부분 대규모의 반복 수작업이 수반되어, 인공지능 개발 프로젝트의 80%를 차지(‘20, 한국지능정보사회진흥원)
ㅇ 그간(’17년~’21년) 한국어(음성·자연어), 영상·이미지, 헬스케어, 교통·물류 등의 분야에서 총 381종의 데이터를 구축*하였고, ’22년에는 310종의 인공지능 학습용 데이터를 추가 구축할 예정이다.
* 191종 기 구축·개방(~‘21.6) 및 ’21년 구축한 190종은 품질검증 등을 거쳐 개방 예정(잠정, ‘22.상반기)
□ ’22년 구축되는 310종은 주제가 주어진 지정과제 250종, 수행기관이 주제를 제안하는 자유과제 30종, 지자체·지역소재기업이 참여하는 지역과제 30종으로, 3월까지 순차적으로 공모된다.
ㅇ 지정과제는 1월부터 3월까지 나누어 공고될 예정으로, 「인공지능 학습용 데이터 구축·활용 고도화 방안」에 제시된 데이터 구축 로드맵에 따라 핵심 분야*를 선정하고,
* 기반기술(한국어, 영상·이미지), 전략분야1(헬스케어, 교통·물류, 재난·안전·환경, 농·축·수산), 전략분야2(제조, 로보틱스, 문화·관광, 스포츠, 교육, 법률, 금융, 지식재산 등)
- 민간·공공을 아우르는 광범위한 수요조사와 기 구축 데이터 분석(’21.9~11월) 등을 통해 발굴된 1,342개 후보데이터를 대상으로 분야별 전문가 및 활용기업 검토, 2차례의 온라인 의견수렴(’21.11~12월) 등을 거쳐 250개의 주제를 확정하였다.
ㅇ 2월에 공고될 지역과제 분야는 지자체·지역소재기업의 참여 활성화를 통해 인공지능 지역 확산을 촉진할 수 있도록 과제 규모를 확대(’21년 20종 → ’22년 30종)하였다.
ㅇ 자유과제 분야는 3월중 공고될 예정으로 기존의 주제 제안형 과제(10종) 외에도, 현재 AI Hub에 개방되어 있는 데이터를 보완·환류*하는 새로운 과제 유형 등이 시범적으로 포함된다.
* (기 구축 데이터 고도화) 정책환경 변화 등에 따라 수량·카테고리 추가 및 품질 보완
(기 구축 데이터 활용·환류) 기존 데이터를 서비스 개발 등에 활용하는 과정에서 수집된 데이터를 AI Hub에 다시 축적·개방
< ’22년 인공지능 학습용 데이터 구축사업 과제 구성(안) >
구분 | ’21년 | ’22년 | 주요내용 | 공고일정(1~3월) | |||
1차 | 2차 | 3차 | |||||
지정과제 | 155 | 250 | AI 기반기술 + 전략분야1 + 전략분야2 | 120 | 90 | 40 | |
자유과제 | 15 | 30 | 10 | 주제 자유 제안 | - | - | 10 |
10 | (신설) 기 구축 데이터 고도화(추가·보완) | - | - | 10 | |||
10 | (신설) 기 구축 데이터 활용·환류 | - | - | 10 | |||
지역과제 | 20 | 30 | 지자체·지역기업 필수 참여 | - | 30 | - | |
계 | 190 | 310 | - | 120 | 120 | 70 |
□ 본 사업 공모와 관련된 상세한 안내는 과학기술정보통신부 홈페이지(www.msit.go.kr)와 한국지능정보사회진흥원 홈페이지(www.nia.or.kr)를 통해 공지되며, 참여를 원하는 기관·기업은 과제별로 컨소시엄을 구성하여 지원하면 된다.
붙임 : ’22년 인공지능 학습용 데이터 지정과제 데이터 목록(1차 공고 120종)
붙임 |
| ‘22년도 인공지능 학습용 데이터 지정과제 데이터 목록(1차 공고 120종) |
□ 한국어 (18종)
순번 | 데이터명 | 개요 |
1 | 방송콘텐츠 대화체 음성인식 데이터 | 한국인 대화체 음성인식 및 문맥 이해의 언어 처리 기술 개발을 위한 방송콘텐츠 기반 대화 데이터 |
2 | 방송콘텐츠 한국어-영어 통·번역 음성 데이터 | 방송 콘텐츠 분야 영어 통·번역 성능 향상 및 한국 문화 콘텐츠 산업 활성화를 위한 영어 통·번역 음성 데이터 |
3 | 방송콘텐츠 한국어-영어 번역 말뭉치 데이터 | 방송 콘텐츠 분야 영어 통·번역 성능 향상 및 한국 문화 콘텐츠 산업 활성화를 위한 영어 번역 말뭉치 |
4 | 방송콘텐츠 한국어-유럽어 통·번역 음성 데이터 | 방송 콘텐츠 분야 영어 통·번역 성능 향상 및 한국 문화 콘텐츠 산업 활성화를 위한 유럽어 통·번역 음성 데이터 |
5 | 방송콘텐츠 한국어-유럽어 번역 말뭉치 | 방송 콘텐츠 분야 영어 통·번역 성능 향상 및 한국 문화 콘텐츠 산업 활성화를 위한 유럽어 번역 말뭉치 |
6 | 방송콘텐츠 한국어-아시아어 통·번역 음성 데이터 | 방송 콘텐츠 분야 영어 통·번역 성능 향상 및 한국 문화 콘텐츠 산업 활성화를 위한 아시아어 통·번역 음성 데이터 |
7 | 방송콘텐츠 한국어-아시아어 번역 말뭉치 | 방송 콘텐츠 분야 영어 통·번역 성능 향상 및 한국 문화 콘텐츠 산업 활성화를 위한 아시아어 번역 말뭉치 |
8 | 페르소나 대화 | 실제 인간과 같이 자연스럽고 똑똑하게 대화하는 인터페이스 구축을 위한 학습용 대화 데이터 |
9 | 지식검색 대화 | 지식을 검색하여 관련된 대화를 할 수 있는 인터페이스 구축을 위한 학습용 대화 데이터 |
10 | 공감형 대화 | 인간과 같은 공감 능력을 갖고 자연스럽게 대화하는 인터페이스 구축을 위한 학습용 데이터 |
11 | 일반상식 문장 교정 데이터 | 온라인 수집 상식의 자연스러운 문장 구성을 위한 교정 정보 라벨링 데이터 |
12 | 일반상식 문장 생성 데이터 | 기계의 자연스러운 문장 생성을 위한 기계생성 문장과 인간생성 문장 비교 학습 데이터 |
13 | 일반상식 문장 생성 평가 데이터 | 기계 생성 문장 검증을 위한 AI 생성 문장 평가 데이터 |
14 | 발화유형(문어·구어·채팅)별 기계번역 병렬 말뭉치 | 다국어 발화유형별(문어, 구어, 방언 등) 번역쌍으로 구성된 기계번역 병력 말뭉치 |
15 | 자연어 분석 후처리용 과교정 검증 데이터 | 기계 교정 데이터의 후처리 정보를 포함한 원문과 한국어 맞춤법, 문법, 음성인식 후처리 병렬 말뭉치 |
16 | 기계번역 품질 검증 데이터 | 기계번역 품질 예측을 위한 원문, 기계번역, 인간의 교정으로 구성된 데이터 쌍 |
17 | 한국어-다국어 번역 말뭉치(기초과학) | 기초과학 분야의 번역 정확도 향상을 위한 한국어-다국어 번역 말뭉치 |
18 | 한국어-다국어 번역 말뭉치(인문학) | 인문학 분야의 번역 정확도 향상을 위한 한국어-다국어 번역 말뭉치 |
□ 영상·이미지 (26종)
순번 | 데이터명 | 개요 |
1 | 픽셀단위 장면 인지 멀티모달 데이터 | 모든 객체를 감지, 분할, 추적하기 위한 비주류 객체 및 자연어 묘사 데이터가 포함된 멀티모달 데이터 |
2 | 비디오 전환 경계 추론 데이터 | 사람의 행동, 시간 정보, 물체 등 다양한 측면에서 비디오의 경계 및 사건 간 인과 관계를 추론하기 위한 데이터 |
3 | 비디오 장면 설명문 생성 데이터 | 인간의 행동은 더 작은 단위의 동작으로 쪼개어 나타낼 수 있으며, 그 쪼개진 단위마다 알맞은 자연어 캡션이 붙어 있는 데이터 |
4 | 유사성 기반 추론 데이터 | 영상 간의 유사성 기반한 시각 추론 능력을 학습하기 위한 데이터 |
5 | 인과 관계 기반 추론 데이터 | 영상 간의 인과 관계에 기반한 시각 추론 능력을 학습하기 위한 데이터 |
6 | 시각 상식 기반 추론 데이터 | 시각적 상식에 기반한 시각 추론 능력을 학습하기 위한 데이터 |
7 | 카테고리 기반 추론 데이터 | 카테고리에 기반한 시각 추론 능력을 학습하기 위한 데이터 구축을 목표로 함 |
8 | 의류 통합 데이터(착용 이미지, 치수 및 원단 정보) | 의류 이미지, 치수 데이터, 착용 이미지, 착용자의 신체 정보, 원단 정보 등이 매칭된 데이터 |
9 | 패션 액세서리 착용 데이터 | 액세서리(안경테, 귀걸이 등)의 세부 정보와 착용 이미지가 매칭된 데이터 |
10 | 연도별 패션 선호도 파악 및 추천 데이터 | 사용자 니즈 기반의 코디 제공을 위한 연도별 패션 선호도 파악 및 추천을 위한 데이터 |
11 | 쉐이프리스 드레스 및 포즈 데이터 | 인체의 실루엣을 따라가지 않는 옷(전통의상, 외투, 원피스 등)의 이미지와 포즈가 매칭된 데이터 |
12 | 의류 디자인 패턴 데이터 | 패션 분야에서 사용되는 다양한 패턴과 해당 패턴의 정보를 매칭한 데이터 |
13 | 객체 인식용 한국형 비전 데이터 | 인공지능 기반의 객체 인식을 위해 고품질의 바운딩 박스 라벨링이 되어있는 이미지·영상 데이터 |
14 | 객체 분할용 한국형 비전 데이터 | 인공지능 기반의 객체 분할을 위해 고품질의 세그멘테이션 라벨링이 되어있는 이미지·영상 데이터 |
15 | 이미지 설명문 추출 및 생성용 한국형 비전 데이터 | 인공지능 기반의 상황 인식을 위한 고품질의 이미지 설명문 어노테이션이 되어있는 이미지·영상 데이터 |
16 | 객체 간 관계성 인지용 한국형 비전 데이터 | 인공지능 기반의 관계 추출을 위한 고품질의 관계성 지도 어노테이션이 되어있는 이미지·영상 데이터 |
17 | 행동 분류 및 상호작용 인식용 한국형 비전 데이터 | 인공지능 기반의 행동 분류를 위한 고품질의 키포인트 라벨링 및 사람객체 상호작용 어노테이션이 되어있는 이미지·영상 데이터 |
18 | 동일 객체 인식 오류 방지 데이터 | 다양한 모양으로 변환된 객체, 응집된 다수의 객체 등을 정확하게 인식하기 위한 시각적 유사도가 낮지만 동일한 객체 데이터 |
19 | 비동일 객체 인식 오류 방지 데이터 | 서로 다른 객체이지만 형태, 색상, 질감 등의 유사성 때문에 생기는 인식 오류(동일 객체로 인식)를 줄이기 위한 유사한 모습을 한 비동일 객체 데이터 |
20 | 개체 레벨 인식 (Instance Level Recognition, ILR) 데이터 | 체계적인 계층구조 설계와 세밀한 분류(Fine-grained classification)를 통해 개체 수준까지 검출·인식하기 위한 개체 레벨 인식 데이터 |
21 | OCR 데이터(고서문자, 옛한글) | 고서 내 기록유산 활용을 목표로, 조선시대 고문헌, 문서 기반 다양한 옛 한글과 고서 한자 데이터 |
22 | OCR 데이터(공공) | 행정, 외교, 문화, 과학기술 등 국가 전반의 주요 공공행정 문서에 특화된 문자 인식 모델을 개발하기 위한 데이터 |
23 | 객체 폐색(occlusion) 데이터 | 장애물 또는 객체 간에 가려진 경우에도 정확한 객체 인식을 위한 형상 추정용 폐색 데이터 |
24 | 훼손 및 블러링 데이터 | 노이즈 영상 내의 객체 인식 및 추적 성능 향상과 노이즈 이미지·영상 복원(블러 제거) 기술을 고도화하기 위한 블러링 데이터 |
25 | 저조도 환경 데이터 | 어두운 환경에서 객체 감지 및 추정, 이미지 향상을 위한 다양한 저조도 환경(실내·실외) 데이터 구축 |
26 | 화질 변환 영상 데이터 | 오염된 영상을 복원 후 영상 인식 모델 학습뿐만 아니라 오염된 영상에서 즉각적인 영상 인식 모델 학습을 위한 훼손된 영상 데이터 구축 |
□ 교통·물류 (16종)
순번 | 데이터명 | 개요 |
1 | OCR 데이터(물류) | 물류 운송 서류(선하증권, 상업송장, 보험증권, 원산지 증명서, 포장 명세서, 영사송장, 검사 증명서 등)에 작성된 인쇄체 및 손글씨 인식을 위한 OCR 데이터 |
2 | 승용 자율주행차 주간 도심도로 데이터 | 주간 도심도로에서의 승용차(4~5인승의 택시 또는 세단) 기반의 자율주행차량 주행 데이터 |
3 | 승용 자율주행차 야간 도심도로 데이터 | 야간 도심도로에서의 승용차(4~5인승의 택시 또는 세단) 기반의 자율주행차량 주행 데이터 |
4 | 승용 자율주행차 주간 자동차 전용도로 데이터 | 주간 자동차 전용도로에서의 승용차(4~5인승의 택시 또는 세단) 기반의 자율주행차량 주행 데이터 |
5 | 승용 자율주행차 야간 자동차 전용도로 데이터 | 야간 자동차 전용도로에서의 승용차(4~5인승의 택시 또는 세단) 기반의 자율주행차량 주행 데이터 |
6 | 승용 자율주행차 악천후 데이터 | 악천후(안개, 비·눈 등) 도심도로에서의 승용차(4~5인승의 택시 또는 세단) 기반의 자율주행차량 주행 데이터 |
7 | 상용 자율주행차 주간 도심도로 데이터 | 주간 도심도로에서의 버스(15인승 이상) 또는 트럭(3톤 이상) 기반의 자율주행차량 주행 데이터 |
8 | 상용 자율주행차 야간 도심도로 데이터 | 야간 도심도로에서의 버스(15인승 이상) 또는 트럭(3톤 이상) 기반의 자율주행차량 주행 데이터 |
9 | 상용 자율주행차 주간 자동차 전용도로 데이터 | 주간 자동차 전용도로에서의 버스(15인승 이상) 또는 트럭(3톤 이상) 기반의 자율주행차량 주행 데이터 |
10 | 상용 자율주행차 야간 자동차 전용도로 데이터 | 야간 자동차 전용도로에서의 버스(15인승 이상) 또는 트럭(3톤 이상) 기반의 자율주행차량 주행 데이터 |
11 | 상용 자율주행차 악천후 데이터 | 악천후(안개, 비·눈 등) 도심도로에서의 버스(15인승 이상) 또는 트럭(3톤 이상) 기반의 자율주행차량 주행 데이터 |
12 | 고정밀데이터 수집차량 주간 도심도로 데이터 | 주간 도심도로에서의 고정밀 센서(카메라, 라이다, 레이더, GNSS/INS 등)와 저장장치가 장착된 데이터 수집 차량 주행 데이터 |
13 | 고정밀데이터 수집차량 야간 도심도로 데이터 | 야간 도심도로에서의 고정밀 센서(카메라, 라이다, 레이더, GNSS/INS 등)와 저장장치가 장착된 데이터 수집 차량 주행 데이터 |
14 | 고정밀데이터 수집차량 주간 자동차 전용도로 데이터 | 주간 자동차 전용도로에서의 고정밀 센서(카메라, 라이다, 레이더, GNSS/INS 등)와 저장장치가 장착된 데이터 수집 차량 주행 데이터 |
15 | 고정밀데이터 수집차량 야간 자동차 전용도로 데이터 | 야간 자동차 전용도로에서의 고정밀 센서(카메라, 라이다, 레이더, GNSS/INS 등)와 저장장치가 장착된 데이터 수집 차량 주행 데이터 |
16 | 고정밀데이터 수집차량 악천후 데이터 | 악천후(안개, 비·눈 등) 도심도로에서의 고정밀 센서(카메라, 라이다, 레이더, GNSS/INS 등)와 저장장치가 장착된 데이터 수집 차량 주행 데이터 |
□ 헬스케어 (26종)
순번 | 데이터명 | 개요 |
1 | 난청 검사 음성 데이터 | 순음청력검사의 어음 검사 효율성 및 정확성 향상을 위한 한국표준 음절어표 음성 데이터 |
2 | 고막 내시경 검사 이미지 데이터 | 각종 귀질환의 간편 진단, 원격 진단 보조 서비스 개발을 위한 고막 내시경 검사 이미지 데이터 |
3 | 청성유발반응검사 데이터 | 난청 질환 감별 진단 보조 서비스 개발을 위한 청성유발 반응검사 데이터 |
4 | 전정기능검사 데이터 | 어지러움(현훈) 질환 진단을 위해 비디오 전정기능검사 데이터 |
5 | 뇌질환 융합 데이터 | 뇌질환 예측 및 진단, 치료 전략 수립을 위한 영상 및 이미지 데이터와 뇌파 기반 뇌연결성 분석 데이터 |
6 | 파킨슨병 및 관련 질환 진단 음성 데이터 | 파킨슨병 및 관련 질환자 구음장애 분석과 질환별 패턴 감별 인공지능 알고리즘 개발을 위한 음성 데이터 |
7 | 치과 내시경 이미지 데이터 | 치과 치료 및 진단, 분석을 위한 구강 내 다면 촬영 이미지 및 기초 임상 정보 데이터 |
8 | 폐암 예후 예측 융합 데이터 | 폐암의 예후 예측 인공지능 모델 개발에 활용할 수 있는 PET, CT 영상 데이터, 병리진단 등 임상정보 데이터 |
9 | 악성 림프종 예후 예측 융합 데이터 | 악성 림프종의 예후 예측 인공지능 모델 개발에 활용할 수 있는 PET, CT 영상데이터, 병리진단 등 임상정보 데이터 |
10 | 암환자 방사선 치료 데이터 | 암환자의 치료에 이용되는 방사선 치료의 치료 계획 이미지 및 치료 임상 데이터 |
11 | 흉부 청진음 데이터 | 흉부 청진음 및 유관 기초검사를 활용한 호흡기질환 의료 지능화 서비스 개발을 위한 데이터 |
12 | 인공호흡기 작동 데이터 | 인공호흡기 이상 반응 예측 및 인공호흡기 조절 가이드를 위한 인공호흡기 데이터 |
13 | 난임시술 배아 이미지 데이터 | 난임 시술에서 임신 확률이 높은 배아 평가, 선택 등에 필요한 배아 이미지 데이터 |
14 | 태아 심박동 모니터링 데이터 | 태아의 건강 상태와 자동 태아심박동 모니터링 선별 검사 기능 구현을 위한 이미지, 센서 및 임상 데이터 |
15 | 신생아 카테터 엑스레이 데이터 | 고위험 신생아 카테터 삽입 후 위치 감지 및 질환 진단 목적 인공지능 모델 개발을 위한 엑스레이 데이터 |
16 | 소아 복부 엑스레이 이미지 데이터 | 소아 복부 질환 진단을 위한 엑스레이 영상 및 임상정보 데이터 |
17 | 소아 뇌파 검사 데이터 | 소아신경정신질환의 뇌활성화 분석을 통한 진단 보조 및 치료 중재 전략 수립을 위한 안정 상태 뇌파 데이터 |
18 | 소아청소년 정신질환 진단 안저 이미지 데이터 | 소아청소년 정신질환을 선별하고 진단하기 위한 소아청소년 대규모 안저 이미지 데이터 |
19 | 만성콩팥병 및 합병증 추적관찰 임상의료 데이터 | 만성콩팥병 및 이로 인한 합병증의 진단, 악화, 합병증 예측 알고리즘 개발을 위한 만성콩팥병 추적관찰 데이터 |
20 | 만성질환 관련 임상 및 생활습관 데이터 | 만성질환 관리에 영향을 미치는 요인 상관관계 분석 기반 인공지능 모델 개발에 필요한 임상데이터 및 생활습관 데이터 |
21 | 근력운동 처방 데이터 | 만성질환, 근골격계 질환, 재활치료 개선 목적의 맞춤형 운동처방을 위한 PHR 및 운동기록정보 데이터 |
22 | 피부질환 병리검사 이미지 데이터 | 피부 질환의 진단에 사용되는 조직검사(디지털 병리) 이미지 데이터 |
23 | 화상 이미지 및 임상 데이터 | 화상 환자의 치유기간 예측 및 가이드 인공지능 개발을 위한 화상환자 이미지, 영상 및 임상 데이터 |
24 | 주요질환별 합성데이터(X-ray) | 개인정보침해 우려 없이 교육, 연구, 사업화에 자유롭게 활용될 수 있도록 기구축된 X-ray 데이터를 활용하여 제작한 합성데이터 |
25 | 주요질환별 합성데이터(CT) | 개인정보침해 우려 없이 교육, 연구, 사업화에 자유롭게 활용될 수 있도록 기구축된 CT 데이터를 활용하여 제작한 합성데이터 |
26 | 주요질환별 합성데이터(MRI) | 개인정보침해 우려 없이 교육, 연구, 사업화에 자유롭게 활용될 수 있도록 기구축된 MRI 데이터를 활용하여 제작한 합성데이터 |
□ 재난·안전·환경 (10종)
순번 | 데이터명 | 개요 |
1 | 소방대원 행동모션 3D 모델링 데이터 | 소방훈련 및 교육 서비스의 AI 기술 콘텐츠 개발을 위한 소방대원 행동모션 3D 데이터 |
2 | 소방시설·장비 3D 스캐닝 데이터 | 디지털트윈 기반의 소방방재 및 소방산업 서비스 목적 AI 기술개발을 위한 소방장비 3D 데이터 |
3 | 화재 영상 3D 데이터 | 소방안전 시뮬레이션 및 예방을 위한 실내외 소방시설 및 화재영상 3D 데이터 |
4 | 산림 수종 3D 스캐닝·모델링 데이터 | 디지털트윈 기반 산림경영을 위한 수목규격이 포함된 산림수종 3D 정밀 데이터 |
5 | 도로교통 시설 3D 스캐닝 데이터 | 메타버스 환경에서 도시 실제 모습을 구현하고 시뮬레이션 하기 위한 도로교통 시설의 3D 데이터 |
6 | 하천시설 3D 스캐닝 데이터 | 디지털트윈 환경에서 스마트 홍수 분석 및 시뮬레이션을 위한 하천시설 3D 데이터 |
7 | Face parsing 데이터 | 얼굴의 각 부분 및 위치추적 영상 생성 및 영상 보정 등의 응용분야에서 각 얼굴의 위치 추정을 위한 데이터 |
8 | 안면인식 에이징 이미지 데이터 | 실종자, 범죄자 등을 추적하기 위한 노화된 안면인식 학습 데이터 |
9 | IR 실제환경 안면 인식데이터 | 안면 이미지 위변조 여부 확인을 위한 IR(IR풀어서 내용넣을것) 카메라 촬용 안면 이미지 데이터 |
10 | 식생 탄소 포집량 식별 데이터 | 식생 탄소 포집량 및 예측 모델 개발을 위한 이미지·라이다 데이터 |
□ 농·축·수산 (8종)
순번 | 데이터명 | 개요 |
1 | 지능형 양봉 데이터 | 꿀벌의 생육상태 진단과 최적 생육 상태 유지를 위한 양봉환경 통합 데이터 |
2 | 노지작물(배추 등) 작황 데이터 | 수급 민간 채소(배추 등)의 드론 영상 기반 작물구분용 학습 데이터 |
3 | 벼 생육이상 인식 데이터 | 드론 영상을 활용하여 벼 도열병, 도복 등의 생육 이상 발생 탐지를 위한 학습 데이터 |
4 | 지능형 스마트양식장 | 양식장 사육 송어, 산천어의 생육상태 진단과 최적 상태 유지를 위한 통합 데이터 |
5 | 지능형 스마트종자배양장 | 어류 종자배양장에서 사육되는 넙치, 강도다리 종자의 생육상태 진단과 최적 상태 유지를 위한 통합 데이터 |
6 | 갑각류 종자생산 데이터 | 갑각류 종자생산과 인공지능 기반 최적 사육환경 유지 및 양식장 관리를 위한 통합 데이터 |
7 | 해조류 종자생산(김) 데이터 | 김 종자의 안정적 생산과 최적의 배양환경 유지, 배양장 관리를 위한 통합 데이터 |
8 | 패류 종자생산(전복) 데이터 | 전복 인공종자의 안정적 생산과 최적의 사육환경 유지, 양식장 관리를 위한 통합 데이터 |
□ 스포츠 (3종)
순번 | 데이터명 | 개요 |
1 | 전술 판정 영상 데이터(축구) | 축구 경기의 전술 및 심판 판정 등 전략과 학습, 분석을 필요로 하는 코칭 프로그램 개발 등을 위한 영상 및 해석 데이터 |
2 | 전술 판정 영상 데이터(농구) | 농구 경기의 전술 및 심판 판정 등 전략과 학습, 분석을 필요로 하는 코칭 프로그램 개발 등을 위한 영상 및 해석 데이터 |
3 | 전술 판정 영상 데이터(핸드볼) | 핸드볼 경기의 전술 및 심판 판정 등 전략과 학습, 분석을 필요로 하는 코칭 프로그램 개발 등을 위한 영상 및 해석 데이터 |
□ 교육 (8종)
순번 | 데이터명 | 개요 |
1 | OCR 데이터(교육) | 교육활동 과정에서 작성된 초중고 학생 손글씨 OCR 데이터 |
2 | 교육용 한국인의 영어 음성 데이터 | 한국인의 외국어 말하기 교육 및 평가를 위한 영어 발화 음성과 학습자 평가가 태깅된 학습용 데이터 |
3 | 교육용 한국인의 중국어·일본어 음성 데이터 | 한국인의 외국어 말하기 교육 및 평가를 위한 중국어, 일본어 발화 음성과 학습자 평가가 태깅된 학습용 데이터 |
4 | 교육용 한국인의 외국어 | 한국인의 외국어 말하기 교육 및 평가를 위한 외국어 발화 음성과 학습자 평가가 태깅된 학습용 데이터 |
5 | 교육용 영어 모국어 사용자의 한국어 음성 데이터 | 영어권 외국인 대상 한국어 교육과 말하기 평가 시스템 개발을 위한 학습용 데이터 |
6 | 교육용 유럽어 모국어 사용자의 한국어 음성 데이터 | 유럽권 외국인 대상 한국어 교육과 말하기 평가 시스템 개발을 위한 학습용 데이터 |
7 | 교육용 중·일어 모국어 사용자의 한국어 음성 데이터 | 중국인 및 일본인 대상 한국어 교육과 말하기 평가 시스템 개발을 위한 학습용 데이터 |
8 | 교육용 아시아어(중·일어 제외) 사용자의 한국어 음성 데이터 | 아시아권 외국인 대상 한국어 교육과 말하기 평가 시스템 개발을 위한 학습용 데이터 |
□ 로보틱스 (3종)
순번 | 데이터명 | 개요 |
1 | 로봇 핸드용 객체 특성 식별 데이터 | 가정용 로봇 핸드 조작 능력 향상을 위한 로봇용 멀티모달 데이터 |
2 | 보행보조 착용형 로봇 모션 데이터 | 하지 착용형 로봇 인터렉션 보행 모션 제어를 위한 데이터 |
3 | 손·팔 협조 객체 파지·조작 동작 데이터 | 가사작업 인공지능 로봇을 위한 물건, 작업(조작) 멀티모달 데이터 |
□ 금융 (1종)
순번 | 데이터명 | 개요 |
1 | OCR 데이터(금융) | 금융 산업에서 온/오프라인 서비스에 적용될 수 있는 손글씨 및 어플리케이션 개발용 OCR 데이터 |
□ 지식재산 (1종)
순번 | 데이터명 | 개요 |
1 | 한국어-다국어(영어 제외) 번역 말뭉치(기술과학) | 기술과학 첨단 분야의 번역 정확도 향상을 위한 한국어-다국어 번역 말뭉치 |