본문 바로가기 주메뉴 바로가기

KISTI, 세계 최대 규모 전장 유전체 연관분석 병렬화 달성

손영주 2022-03-30 View. 6,437

KISTI, 세계 최대 규모 전장 유전체 연관분석 병렬화 달성

- 병렬컴퓨팅 기술 통해 전장유전체 통계오류 보정계산 최적화 실현 -


A. MPI-GWAS 알고리즘 개요도: 무작위 순열조합(N-Permutation)의 빠른 계산을 위해

MPI-Rank를 통한 동시/병렬분석을 진행함


B-C. 성능평가결과: (B) 병렬처리노드 증가를 통해 전체계산시간 감소확인

(C) 데이터와 병렬처리노드 동시증가에 따른 수행시간의 확장성 확인



한국과학기술정보연구원(원장 김재수, 이하 KISTI)은 전장유전체 연관분석(Genome Wide Association Study, 이하 GWAS)의 통계 오류*를 보정하기 위한 거대규모 슈퍼컴퓨팅 소프트웨어(SW)를 개발하였다고 밝혔다.

* 거대 규모 전장 유전체 분석에 따른 통계 유의성 계산 결과가 위양성(False-positive)으로 보고되는 현상을 뜻함. GWAS 분야의 위양성은 대표사례로 질병연관성이 낮은 유전변이가 질병 발병과 연관성이 높은 것으로 보고되는 것이 있음

  

KISTI 국가 슈퍼컴퓨터 5호기 누리온에서 개발된 SW를 활용해 한국인 코호트 7,523명과 영국인 코호트 4,242명에서 보고된 84,295개의 유전변이에 따른 당뇨, 고혈압과 연관된 유전변이를 GWAS 계산을 통해 도출하고, 최대 70억 회 이상의 무작위 조합(random permutation)을 수행하여 통계 오류를 보정 할 수 있었다.


이번 슈퍼컴퓨팅 시뮬레이션 SW는 국가 슈퍼컴퓨터 5호기 누리온의 최대 2500 노드*를 동시에 사용하여 기존 통계 프로그램 대비 약 300% 이상의 계산 가속화가 가능하다. 

* 약 7.5 패타플롭스(1패타플롭스 = 1초당 1000조회 계산) 정도의 고성능 연산이 가능한 수준으로 KISTI 슈퍼컴퓨터 5호기 성능의 약 25%를 차지하는 규모임


GWAS 분석 결과는 표현형(질병 또는 과일의 무게 등)과 연관된 유전변이의 선발을 목표로 하며, 유의미한 질병 연관 유전변이의 발견은 개인 맞춤형 건강 관리 및 농축산 분야의 신품종 개량을 가능하게 하는 중요한 지표로 여겨지고 있다. 따라서 GWAS 분석 결과의 통계 오류 보정은 필수적이다.


GWAS 분석의 통계 오류 보정은 방대한 계산으로 인해 해당 분야 연구 난제로 남아있었다. KISTI는 계산 병렬화 기술을 통해 대규모의 슈퍼컴퓨팅 기반 패타플롭스 규모의 계산으로 기존의 통계오류 보정이 가능함을 확인했다. KISTI의 국가 슈퍼컴퓨터 5호기 누리온을 활용하여 세계최대 규모(7.5페타플롭스)로 GWAS에 대해서 수행하였다.


권오경 박사와 백효정 박사는 “이번 GWAS 관련 병렬화 SW는 소스코드*를 공개하여 다양한 유전체 연구자들이 자유롭게 활용할 수 있도록 하였으므로 유전체 분야에 슈퍼컴퓨터를 활용한 연구 효율화가 기대된다”고 하였다. 관련 연구 내용은 국제 저널인 Genomics & Informatics에 3월 31일 게재 될 예정**이다.

* https://github.com/hypaik/proj_MPIGWAS

** Paik et al, MPI-GWAS: a supercomputing-aided permutation approach for genome-wide association studies (2022년 3월 31일 게재예정, Genomics & Informatics)

 

KISTI 슈퍼컴퓨팅응용센터 정민중 센터장은 “KISTI는 거대규모의 계산을 필요로 하는 슈퍼컴퓨터 사용자들에게 최적병렬화* 기술 및 계산자원을 지원하고 있다. 배포된 슈퍼컴퓨팅 시뮬레이션 SW로 바이오 및 의료분야 연구 효율화가 마련될 수 있을 것으로 기대한다”라고 밝혔다.

* 최적병렬화는 슈퍼컴퓨터에서 수천대의 CPU가 동시에 수행할 수 있게 코드를 개발하여 어려운 문제를 해결하는 기술

OPEN 출처표시, 상업용금지, 변경금지, 공공누리 공공저작물 자유이용허락

본 저작물은 “공공누리 제4유형(출처표시, 상업적 이용금지, 변경금지)” 조건에 따라 누구나 이용할 수 있습니다.

이 페이지에서 정보에 대해 만족하십니까?
  • 담당부서
  • 담당자박성욱
  • 연락처042-869-1610
Back to Top