IBS, 정확도·효율성 높인 생명과학 데이터 분석 도구 개발
[충청뉴스 이성현 기자] 기존보다 최대 30배 빠른 속도로 안정적인 결과만을 자동으로 선별해 대규모 생명과학 데이터 분석의 정확도와 효율성을 획기적으로 향상하는 방법이 나왔다.
기초과학연구원(IBS)은 수리 및 계산 과학 연구단 의생명 수학 그룹 김재경 CI 연구팀이 세포 분류(클러스터링) 결과의 안정성을 수학적으로 평가해 불안정한 결과를 걸러내는 새로운 분석 도구인 ‘scICE(single-cell Inconsistency Clustering Estimator)’를 개발했다고 3일 밝혔다.
연구팀이 개발한 scICE는 한 번의 분석만으로도 얼마나 일관성 있게 결과가 도출됐는지를 수학적으로 평가한다.
새로 도입한 ‘불일치 계수(IC)’를 통해 많은 계산량이 요구되는 연산 없이도 클러스터 간 안정성을 정량적으로 판단할 수 있다. 모든 세포를 일일이 비교하던 기존 방식과 달리, 불일치 계수를 활용한 안정성 평가는 클러스터 구조 간 유사성만 평가해 비교 대상을 획기적으로 줄일 수 있어 분석 시간을 크게 단축한다.
연구팀은 뇌, 폐, 혈액 등 다양한 조직에서 수집된 48개의 실제 및 모의 scRNA-seq 데이터에 scICE를 적용하여 그 유효성을 입증했다.
그 결과 기존 분석 결과 중 약 3분의 2는 통계적으로 불안정하며 신뢰하기 어렵다는 사실을 밝혀냈다. 반면 scICE는 신뢰할 수 있는 결과만을 선별해 연구자의 시간과 계산 자원을 절약하면서도 정확도를 한층 높였다.
또 scICE는 일반적인 클러스터링으로는 놓치기 쉬운 희귀한 세포 유형을 효과적으로 탐지했다.
실제로 일부 데이터에서 찾기 어려웠던 희귀 면역세포들을 scICE 기반의 서브클러스터링을 통해 안정적으로 식별해냈다.
김재경 CI는 “이번 연구는 수학적 아이디어가 어떻게 생명과학의 핵심 문제를 해결하고 분석 과정을 혁신할 수 있는지를 보여주는 성과”라며 “클러스터링 신뢰도의 중요성이 간과되어 온 측면이 있는데, 이번 기회로 scICE가 생명과학 분야에서 신뢰도 높은 데이터 해석을 가능케 하는 표준 도구로 자리 잡기를 기대한다”고 말했다.