본문 바로가기 주메뉴 바로가기

KISTI, 과학기술계 인공지능 생태계 구축 방안 제시

최나은 2022-12-29 View. 2,411

KISTI, 과학기술계 인공지능 생태계 구축 방안 제시

- AI 학습데이터, AI 학습모델, 소스 코드 공유 필요성 제기 -

- AIDA 통해 인공지능 학습 데이터 셋 9종 약 3천만 건 제공 -


□ 한국과학기술정보연구원(원장 김재수이하 KISTI) 인공지능 기반의 과학 및 현안 해결을 위한 과학기술 인공지능 생태계 구축 및 서비스 방안에 대한 KISTI 이슈브리프*를 발간했다.

   * 국가 과학기술 정보 분야의 대표 연구기관인 KISTI는 최근의 과학기술 정보 관련 현안이슈를 발굴분석하여 시사점 및 해결 방안을 제시하고자 KISTI 이슈브리프를 발간하고 있다(https://www.kisti.re.kr/post/issuebrief).


□ 인공지능 기술은 과학기술과 산업기술의 성장과 혁신을 가속하는 핵심 기술로 대두되고 있으며우리나라를 포함한 세계 주요국들은 인공지능 관련 정책과 비전을 발표해 왔다.

 - 그러나영국의 데이터 분석 미디어 토터스인텔리전스(Tortoise Intelligence)의 글로벌AI지수 조사 결과, 2022년 우리나라의 인공지능 경쟁력 순위는 세계 7위를 기록했으며인재 부문 28운영환경 부문 32위에 그쳤다.

 - 또한우리나라는 AI 논문 수 세계 9논문 편당 인용 수 31원천기술 연구자 규모가 미국의 4%에 불과한 등 글로벌 AI 경쟁력이 열악한 것으로 분석됐다.


□ KISTI는 과학기술 분야의 AI 생태계 플랫폼인 AIDA(AI Data Archive)를 구축해 과학기술 인공지능 데이터에의 자유로운 접근과 데이터 처리분석 등을 지원하는 서비스를 제공하고 있다.

 - ‘AIDA’는 다양한 분야의 연구자들이 인공지능 학습 데이터를 자유롭게 활용하고 연구에 활용된 소스 코드모델분석 결과 등을 공유하여 과학 및 사회문제를 효과적으로 해결할 수 있도록 사전학습모델 기반의 맞춤형 인공지능 모델 생성 환경을 제공한다.

 - KISTI는 R&D 혁신과 디지털 전환 가속화를 위해 AIDA를 통해 기계 실행 가능한 링크드 데이터 서비스와 활용 인프라 구축, AI 데이터 분석·활용 워크벤치 및 코드 재현성 검증 기술개발문제 해결을 위한 인공지능 기반 협업 환경 등을 제공하고자 한다.


□ 또한, KISTI는 AIDA를 통해 과학기술 기계학습 데이터셋 9종 약 3,000만 건의 데이터와 다양한 AI 연구 지원 서비스를 제공하고 있다.

 - AIDA는 다양한 형태의 인공지능 데이터 저장과 검색, Open API 제공인공지능 데이터셋의 활용 사례 등록 및 검색데이터 활용 신청 등 다양한 서비스를 제공한다.

 - 특히국내 과학기술 논문과 특허 약 3억 8천만 문장에서 추출한 사전학습언어모델을 활용할 수 있도록 주피터랩(JupyterLab) 기반의 개발환경 인터페이스를 제공하고 있다.

 - AIDA의 학습데이터 레이블링 저작도구는 사전학습모델 기반 자동 레이블링 기능을 지원함으로써 학습데이터 제작의 편의성과 생산성을 향상시킨다.


□ KISTI 기계학습데이터연구단은 최근 AI 분야에서 화두인 멀티모달 AI에 대한 데이터셋과 기술개발을 진행할 계획이다.

 - 다양한 유형의 정보(텍스트이미지오디오비디오 등)를 통하여 인간의 사고방식을 모방하는 기술인 멀티모달이 등장하고 있다.

 - KISTI는 과학기술 분야의 다양한 포맷에 대한 멀티모달 데이터셋 및 활용 기술을 개발하여 멀티모달 AI에 대한 수요에 대응할 예정이다.

OPEN 출처표시, 상업용금지, 변경금지, 공공누리 공공저작물 자유이용허락

본 저작물은 “공공누리 제4유형(출처표시, 상업적 이용금지, 변경금지)” 조건에 따라 누구나 이용할 수 있습니다.

이 페이지에서 정보에 대해 만족하십니까?
  • 담당부서대외협력실
  • 담당자최나은
  • 연락처042-869-0966
Back to Top