KAIST, 기계학습 기반 유전체 정렬 소프트웨어 개발
KAIST, 기계학습 기반 유전체 정렬 소프트웨어 개발
  • 이성현 기자
  • 승인 2022.04.12 13:00
  • 댓글 0
이 기사를 공유합니다

머신러닝 모델을 통해 유전체 조각의 위치를 예측하는 과정 모식도
머신러닝 모델을 통해 유전체 조각의 위치를 예측하는 과정 모식도

[충청뉴스 이성현 기자] 한국과학기술원(KAIST)은 전기및전자공학부 한동수 교수 연구팀이 머신러닝(기계학습) 기반의 유전체 정렬 소프트웨어를 개발했다고 12일 밝혔다.

연구팀이 개발한 유전체 정렬 소프트웨어는 차세대 염기서열 분석 방법으로 생성한 유전체 조각 데이터를 온전한 유전체 정보로 조립하기 위해 사용되는 소프트웨어다.

유전체 정렬 작업에는 많은 연산이 들어가며, 속도를 높이고 비용을 낮추는 방법에 관한 관심이 계속해서 증가하고 있다. 머신러닝(기계학습) 기반의 인덱싱(색인) 기법을 유전체 정렬 소프트웨어에 적용한 사례는 이번이 최초다.

이번 소프트웨어는 연산량을 대폭 줄이면서도 표준 유전체 정렬 소프트웨어 BWA-MEM2과 동일한 결과를 만들어 정확도를 유지했다.

사용한 머신러닝 기반의 인덱싱 기법은 주어진 데이터의 분포를 머신러닝 모델이 학습해, 데이터 분포에 최적화된 인덱싱을 찾는 방법론이다. 데이터에 적합하다고 생각되는 인덱싱 방법을 사람이 정하던 기존의 방법과 대비된다.

연구팀이 제안한 알고리즘은 머신러닝 기반의 인덱싱 기법을 활용해 유전자 조각 길이와 상관없이 적은 연산량으로도 유전자 조각의 위치를 찾을 수 있다. 이를 통하면 기존과 비교해 3.4배 정도 가속화되며 이로 인해 유전체 정렬 소프트웨어도 1.4배 가속화됐다.

연구팀이 이번 연구에서 개발한 유전체 정렬 소프트웨어는 오픈소스 (https://github.com/kaist-ina/BWA-MEME)로 공개돼 많은 분야에 사용될 것으로 기대되며, 유전체 분석에서 사용되는 다양한 소프트웨어를 머신러닝 기술로 가속화하는 연구들의 초석이 될 것으로 기대된다.

한동수 교수는 "이번 연구를 통해 기계학습 기술을 접목해 전장 유전체 빅데이터 분석을 기존 방식보다 빠르고 적은 비용으로 할 수 있다는 것을 보여줬으며, 앞으로 인공지능 기술을 활용해 전장 유전체 빅데이터 분석을 효율화, 고도화할 수 있을 것이라 기대된다ˮ고 밝혔다.

기사가 마음에 드셨나요?

충청뉴스 좋은 기사 후원하기


※ 소중한 후원금은 더 좋은 기사를 만드는데 쓰겠습니다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.