첨부파일(3)
KISTI, 「데이터셋 연계전략」이슈브리프 발간
- 데이터 활용성 확대를 위한 데이터셋 연계전략 제시 -
-데이터셋의 성공적 연계를 위해 데이터에 대한 이해와 표준화가 필수 -
□ 한국과학기술정보연구원(원장 김재수, 이하 KISTI)은 지자체 현안해결 지원을 위한 데이터셋 연계전략에 대한 『KISTI 이슈브리프』를 발간했다.
□ 데이터 기반 문제 해결 연구에 앞장서고 있는 KISTI는 이번 이슈브리프를 통해 각 분야의 다양한 데이터셋 연계사례와 함께 데이터셋을 효율적으로 연계하여 활용하기 위한 핵심 전략과 기술을 소개하고 있다.
□ 여러 출처의 정보를 결합하는 데이터셋 연계는 기후, 인구, 산업화 등 복합적인 원인으로 발생하는 사회현안 해결이나 경제·사회적 부가가치 창출을 위해 꼭 필요한 데이터 운영 전략이다.
⭘ 국내외에서는 전염병 대응을 위해서 감염병 데이터, 방역 데이터, 의료 데이터 등 여러 정보를 연계해서 분석하고 있으며
⭘ 지자체를 중심으로 자체 보유한 데이터셋과 카드 이용 정보 등 민간데이터셋을 함께 분석하여 지역상권 분석정보나 맞춤형 관광지 추천정보를 제공하는 등 지역경제 활성화를 위해 데이터를 연계해 활용하는 사례도 증가하고 있다.
□ KISTI는 금번 이슈브리프를 통해 공공데이터포털의 데이터셋 57,421종의 항목명 200만여 건과 지진, 침수, 미세먼지 분야 402종 데이터셋의 내용을 분석한 결과를 바탕으로 데이터 표준화와 데이터 활용 목적 이해를 통한 연계전략을 제안하였다.
□ 여러 데이터셋을 결합하여 동일 의미 항목과 내용을 함께 분석하기 위해서는 항목명 표준화와 값 표준화 등 데이터 표준화가 필수적이다.
⭘ 예를 들어, ‘위도’, ‘LATITUDE’, ‘위도값’,‘위도 좌표’등의 항목명이 동일 의미를 갖는 다는 것을 관리할 경우 ‘위도’를 기준으로 분석할 수 있는 여러 데이터셋의 발견과 활용이 가능하다.
⭘ 위치를 기준으로 데이터를 분석하기 위해서는 ‘도로명주소’, ‘지번주소’, ‘위도/경도’, ‘좌표’ 등 다양하게 표현된 값을 상호 매핑할 수 있어야 한다.
□ 또한, 데이터셋을 어디에 어떻게 활용할 것인지를 미리 고려하고 데이터에 대한 이해를 바탕으로 한 데이터 연계 전략 수립이 필요하다.
⭘ 데이터셋의 활용 목적은 해당 데이터셋을 구성하는 항목이나 실제 값을 통해 이해가 가능하며
⭘ 데이터셋 동시 활용사례를 분석하는 것은 다양한 목적과 분야의 데이터셋 연계 요구를 이해하는 데 도움이 된다.
□ 아울러, 이슈브리프에는 실제 데이터셋을 연계하고자 하는 모든 분야에 적용할 수 있는 항목명 표준화 및 데이터값 표준화 방안과 이를 통한 데이터셋 연계결과가 소개되어있다.
□ KISTI 김재수 원장은 ‘대형화, 복합화되고 있는 사회현안 해결지원을 위해 다차원적 분석을 위한 데이터의 중요성이 강조되는 상황에서 KISTI는 데이터 종합연구기관으로서 데이터 연계의 핵심 전략과 기술 발전을 위해 더욱 노력할 계획이다’라고 밝혔다.
□ KISTI는 최근의 과학기술 정보 관련 현안‧이슈를 발굴‧분석하여 시사점 및 해결 방안을 제시하고자 「KISTI 이슈브리프」를 발간하고 있으며 홈페이지(https://www.kisti.re.kr/post/issuebrief)에서 확인 가능하다.
본 저작물은 “공공누리 제4유형(출처표시, 상업적 이용금지, 변경금지)” 조건에 따라 누구나 이용할 수 있습니다.