첨부파일(2)
KISTI, 과학기술계 인공지능 생태계 구축 방안 제시
- AI 학습데이터, AI 학습모델, 소스 코드 공유 필요성 제기 -
- AIDA 통해 인공지능 학습 데이터 셋 9종 약 3천만 건 제공 -
□ 한국과학기술정보연구원(원장 김재수, 이하 KISTI)은 인공지능 기반의 과학 및 현안 해결을 위한 과학기술 인공지능 생태계 구축 및 서비스 방안에 대한 『KISTI 이슈브리프*』를 발간했다.
* 국가 과학기술 정보 분야의 대표 연구기관인 KISTI는 최근의 과학기술 정보 관련 현안‧이슈를 발굴‧분석하여 시사점 및 해결 방안을 제시하고자 「KISTI 이슈브리프」를 발간하고 있다(https://www.kisti.re.kr/post/issuebrief).
□ 인공지능 기술은 과학기술과 산업기술의 성장과 혁신을 가속하는 핵심 기술로 대두되고 있으며, 우리나라를 포함한 세계 주요국들은 인공지능 관련 정책과 비전을 발표해 왔다.
- 그러나, 영국의 데이터 분석 미디어 토터스인텔리전스(Tortoise Intelligence)의 글로벌AI지수 조사 결과, 2022년 우리나라의 인공지능 경쟁력 순위는 세계 7위를 기록했으며, 인재 부문 28위, 운영환경 부문 32위에 그쳤다.
- 또한, 우리나라는 AI 논문 수 세계 9위, 논문 편당 인용 수 31위, 원천기술 연구자 규모가 미국의 4%에 불과한 등 글로벌 AI 경쟁력이 열악한 것으로 분석됐다.
□ KISTI는 과학기술 분야의 AI 생태계 플랫폼인 AIDA(AI Data Archive)를 구축해 과학기술 인공지능 데이터에의 자유로운 접근과 데이터 처리, 분석 등을 지원하는 서비스를 제공하고 있다.
- ‘AIDA’는 다양한 분야의 연구자들이 인공지능 학습 데이터를 자유롭게 활용하고 연구에 활용된 소스 코드, 모델, 분석 결과 등을 공유하여 과학 및 사회문제를 효과적으로 해결할 수 있도록 사전학습모델 기반의 맞춤형 인공지능 모델 생성 환경을 제공한다.
- KISTI는 R&D 혁신과 디지털 전환 가속화를 위해 AIDA를 통해 기계 실행 가능한 링크드 데이터 서비스와 활용 인프라 구축, AI 데이터 분석·활용 워크벤치 및 코드 재현성 검증 기술개발, 문제 해결을 위한 인공지능 기반 협업 환경 등을 제공하고자 한다.
□ 또한, KISTI는 AIDA를 통해 과학기술 기계학습 데이터셋 9종 약 3,000만 건의 데이터와 다양한 AI 연구 지원 서비스를 제공하고 있다.
- AIDA는 다양한 형태의 인공지능 데이터 저장과 검색, Open API 제공, 인공지능 데이터셋의 활용 사례 등록 및 검색, 데이터 활용 신청 등 다양한 서비스를 제공한다.
- 특히, 국내 과학기술 논문과 특허 약 3억 8천만 문장에서 추출한 사전학습언어모델을 활용할 수 있도록 주피터랩(JupyterLab) 기반의 개발환경 인터페이스를 제공하고 있다.
- AIDA의 학습데이터 레이블링 저작도구는 사전학습모델 기반 자동 레이블링 기능을 지원함으로써 학습데이터 제작의 편의성과 생산성을 향상시킨다.
□ KISTI 기계학습데이터연구단은 최근 AI 분야에서 화두인 멀티모달 AI에 대한 데이터셋과 기술개발을 진행할 계획이다.
- 다양한 유형의 정보(텍스트, 이미지, 오디오, 비디오 등)를 통하여 인간의 사고방식을 모방하는 기술인 멀티모달이 등장하고 있다.
- KISTI는 과학기술 분야의 다양한 포맷에 대한 멀티모달 데이터셋 및 활용 기술을 개발하여 멀티모달 AI에 대한 수요에 대응할 예정이다.
본 저작물은 “공공누리 제4유형(출처표시, 상업적 이용금지, 변경금지)” 조건에 따라 누구나 이용할 수 있습니다.