본문 바로가기 주메뉴 바로가기

KISTI, 「데이터셋 연계전략」이슈브리프 발간

박성욱 2023-05-15 View. 12,975

KISTI, 데이터셋 연계전략이슈브리프 발간

- 데이터 활용성 확대를 위한 데이터셋 연계전략 제시 -

-데이터셋의 성공적 연계를 위해 데이터에 대한 이해와 표준화가 필수 -



한국과학기술정보연구원(원장 김재수, 이하 KISTI) 지자체 현안해결 지원을 위한 데이터셋 연계전략에 대한 KISTI 이슈브리프를 발간했다.

 

데이터 기반 문제 해결 연구에 앞장서고 있는 KISTI는 이번 이슈브리프를 통해 각 분야의 다양한 데이터셋 연계사례와 함께 데이터셋을 효율적으로 연계하여 활용하기 위한 핵심 전략과 기술을 소개하고 있다.

 

여러 출처의 정보를 결합하는 데이터셋 연계는 기후, 인구, 산업화 등 복합적인 원인으로 발생하는 사회현안 해결이나 경제·사회적 부가가치 창출을 위해 꼭 필요한 데이터 운영 전략이다.

국내외에서는 전염병 대응을 위해서 감염병 데이터, 방역 데이터, 의료 데이터 등 여러 정보를 연계해서 분석하고 있으며

 

지자체를 중심으로 자체 보유한 데이터셋과 카드 이용 정보 등 민간데이터셋을 함께 분석하여 지역상권 분석정보나 맞춤형 관광지 추천정보를 제공하는 등 지역경제 활성화를 위해 데이터를 연계해 활용하는 사례도 증가하고 있다.

 

KISTI는 금번 이슈브리프를 통해 공공데이터포털의 데이터셋 57,421종의 항목명 200만여 건과 지진, 침수, 미세먼지 분야 402종 데이터셋의 내용을 분석한 결과를 바탕으로 데이터 표준화와 데이터 활용 목적 이해를 통한 연계전략을 제안하였다.

 

여러 데이터셋을 결합하여 동일 의미 항목과 내용을 함께 분석하기 위해서는 항목명 표준화와 값 표준화 등 데이터 표준화가 필수적이다.

예를 들어, ‘위도’, ‘LATITUDE’, ‘위도값’,‘위도 좌표등의 항목명이 동일 의미를 갖는 다는 것을 관리할 경우 위도를 기준으로 분석할 수 있는 여러 데이터셋의 발견과 활용이 가능하다.

위치를 기준으로 데이터를 분석하기 위해서는 도로명주소’, ‘지번주소’, ‘위도/경도’, ‘좌표등 다양하게 표현된 값을 상호 매핑할 수 있어야 한다.

 

또한, 데이터셋을 어디에 어떻게 활용할 것인지를 미리 고려하고 데이터에 대한 이해를 바탕으로 한 데이터 연계 전략 수립이 필요하다.

데이터셋의 활용 목적은 해당 데이터셋을 구성하는 항목이나 실제 값을 통해 이해가 가능하며

데이터셋 동시 활용사례를 분석하는 것은 다양한 목적과 분야의 데이터셋 연계 요구를 이해하는 데 도움이 된다.

 

아울러, 이슈브리프에는 실제 데이터셋을 연계하고자 하는 모든 분야에 적용할 수 있는 항목명 표준화 및 데이터값 표준화 방안과 이를 통한 데이터셋 연계결과가 소개되어있다.

 

KISTI 김재수 원장은 대형화, 복합화되고 있는 사회현안 해결지원을 위해 다차원적 분석을 위한 데이터의 중요성이 강조되는 상황에서 KISTI는 데이터 종합연구기관으로서 데이터 연계의 핵심 전략과 기술 발전을 위해 더욱 노력할 계획이다라고 밝혔다.

 

KISTI는 최근의 과학기술 정보 관련 현안이슈를 발굴분석하여 시사점 및 해결 방안을 제시하고자 KISTI 이슈브리프를 발간하고 있으며 홈페이지(https://www.kisti.re.kr/post/issuebrief)에서 확인 가능하다.

OPEN 출처표시, 상업용금지, 변경금지, 공공누리 공공저작물 자유이용허락

본 저작물은 “공공누리 제4유형(출처표시, 상업적 이용금지, 변경금지)” 조건에 따라 누구나 이용할 수 있습니다.

이 페이지에서 정보에 대해 만족하십니까?
  • 담당부서
  • 담당자박성욱
  • 연락처042-869-1610
Back to Top