선문대 유전체 기반 BioIT 융합연구소, 효소 기능 예측 AI 모델 ‘HIT-EC’ 개발 성공
[충청뉴스 유규상 기자] 선문대학교(총장 문성제) 유전체 기반 BioIT 융합연구소 오태진 교수 연구팀이 단백질 서열로부터 효소 기능을 예측할 수 있는 인공지능(AI) 모델을 개발해 국제 학술지에 개재했다.
선문대는 유전체 기반 BioIT 융합연구소 오태진 교수와 한소라 교수가 미국 네바다대학교 라스베이거스(UNLV) 강민곤 교수, 극지연구소 이준혁 박사와 공동연구로 효소 기능(EC번호)을 예측하는 트랜스포머 기반 딥러닝 모델 ‘HIT-EC’를 개발했다고 9일 밝혔다.
효소는 생물체 내에서 다양한 화학 반응을 빠르게 촉진하는 단백질로, 국제 표준 코드인 EC 번호(Enzyme Commission number)로 분류한다. EC 번호는 4단계 숫자 체계로 구성된 계층형 분류 구조이며, 숫자가 깊어질수록 효소의 기능이 더욱 구체적으로 정의된다.
연구팀이 개발한 HIT-EC는 ‘Hierarchical Interpretable Transformer’(계층형·해석가능 트랜스포머) 기반으로 EC 번호를 예측하는 모델이며, 단순히 “정답을 맞히는 것”에서 그치지 않고, 단백질 서열 중 어떤 부분을 근거로 그렇게 판단했는지(근거/증거)를 함께 제시 가능하기에 예측 관련 신뢰도를 높였다.
공동연구팀은 대규모 단백질 데이터셋과 다양한 평가 시나리오를 통해 HIT-EC의 성능을 검증했다. 특히 귀 클래스 및 종이 다른 환경에서도 안정적인 예측 성능과 높은 일반화 가능성을 확인했다. 또한 모델이 제시한 중요 서열 위치가 실제 알려진 촉매 모티프 및 기능 잔기와 일치하는지 분석해 생물학적 타당성도 검증했다.
오태진 교수는 “이번 연구는 생명공학과 컴퓨터공학의 융합 연구를 통해 유전체 빅데이터를 신뢰 가능한 AI로 분석한 대표 사례”라면서, “효소 기능 예측의 정확도와 해석 가능성을 동시에 높여 디지털 헬스케어와 제약·바이오 산업 발전에 기여할 것으로 기대된다”고 말했다.
한편 연구결과는 “Trustworthy prediction of enzyme commission numbers using a hierarchical interpretable transformer”라는 제목으로 세계적 권위의 학술지 네이처 커뮤니케이션즈(Nature Communications)에 지난 1월 30일 게재됐으며, 한국을 빛낸 사람들(한빛사)에도 선정됐다.