KAIST, 차세대 통합 데이터베이스 ‘아카식DB’ 개발
[충청뉴스 이성현 기자] 기업용 인공지능(AI) 에이전트 도입의 최대 걸림돌이었던 ‘환각(Hallucination) 현상’을 획기적으로 해결할 수 있는 차세대 데이터베이스(DB) 기술이 국내 연구진에 의해 개발됐다.
한국과학기술원(KAIST)은 전산학부 김민수 교수 연구팀이 교원창업기업인 (주)그래파이와 협력하여 벡터 DB, 그래프 DB, 관계형 DB 기능을 하나의 시스템에 유기적으로 결합한 차세대 통합 데이터베이스 관리 시스템(DBMS)인 '아카식DB(AkasicDB)'와 이를 활용한 신개념 검색증강생성(RAG) 기법인 '옴니RAG(Omni RAG)'를 개발했다고 19일 밝혔다.
최근 기업들은 사내 내부 문서와 전문 지식을 AI가 찾아내 답변을 생성하도록 돕는 검색증강생성(RAG) 기술을 적극 도입하고 있다.
그러나 실제 기업 데이터는 가공되지 않은 보고서(비정형), 사람·기업 간의 얽힌 관계(그래프), 정형화된 표나 숫자(관계형) 등 다양한 형태로 흩어져 있다.
기존 RAG 기술은 단어의 의미적 유사성만 따지는 '벡터 검색'에 주로 의존해 왔기 때문에, 날짜나 유형을 필터링하거나 복잡한 지식 관계를 추론해야 하는 복합 질의 앞에서는 엉뚱한 답변을 내놓는 '환각 현상'을 고질적으로 겪어왔다.
예를 들어 "작년에 체결된 계약서 중 A사와 관련된 조항을 찾고, 해당 조항이 어떤 제품 공급 이슈와 연결되는지 설명해 달라"는 복합적인 질문을 던지면 기존에는 벡터, 그래프, 관계형 DB를 각각 따로 가동해 코딩으로 결과를 억지로 결합해야 했다.
이 과정에서 시스템 관리 복잡성이 극도로 치솟고 응답 속도가 심각하게 지연되는 한계가 존재했다.
연구팀은 저장 구조부터 질의 처리 엔진, 비용 기반 질의 최적화기까지 데이터베이스의 핵심 요소를 아예 바닥부터 새롭게 설계했다.
아카식DB는 개별적으로 운영되던 세 가지 DB 모델을 단일 엔진 내부에서 동시 최적화해 연산하는 ‘네이티브 통합 구조’를 실현했다.
사용자는 복합 RAG 질의를 전통적인 표 형태 언어(SQL)와 그래프 전용 언어(GQL)가 결합된 단 하나의 질의문으로 간단히 표현할 수 있으며 시스템 내부에서 불필요한 데이터 이동 없이 단 한 번에 처리된다.
이 통합 인프라를 기반으로 작동하는 ‘옴니RAG’는 문서의 의미 정보, 지식 그래프의 관계 정보, 표 형태 데이터의 구조적 조건을 완벽하게 융합해 LLM(대규모언어모델)에 완벽한 근거를 제공한다.
그 결과 기존 RAG 방식 대비 AI 답변의 정확도를 최대 78%까지 끌어올렸으며, 불필요한 중간 데이터 생성을 최소화해 기존에 21.3초가 걸리던 복합 검색을 1초 미만으로 단축하며 최대 20배 이상의 속도 개선을 달성했다. LLM의 토큰 사용량도 획기적으로 절감됐다.
이번 연구는 작년 세계적 학회인 ‘VLDB 2025’에서 연구팀이 발표했던 그래프-관계형 통합 DB 기술(Chimera)을 한 단계 더 진화시켜 ‘벡터’ 영역까지 통합을 완성해 낸 쾌거다.
현재 아카식DB는 연구 개발 단계에 머무르지 않고, 교원창업기업 (주)그래파이를 통해 이미 상용화가 완료된 상태다. 그래파이는 현재 금융, 제조, 국방 분야의 다양한 기업 및 기관을 대상으로 아카식DB 기반의 고신뢰성 AI 에이전트 및 RAG 서비스를 활발히 구축하고 있다.
향후 이 기술은 방대한 기술 문서와 장비 매뉴얼을 다루는 국방·제조 분야, 복잡한 규정과 거래 이력을 분석해야 하는 금융 분야, 전문적인 판례와 지식 관계 추론이 필수적인 법률 및 과학기술 분야 등 고도의 정확성이 요구되는 전 산업 영역의 핵심 데이터 인프라로 안착할 전망이다.
김민수 교수는 “많은 이들이 AI의 환각을 모델 자체의 한계로 보지만, 진정한 해결책은 AI가 참조하는 데이터 인프라를 혁신하는 데 있다”며 “아카식DB를 기업의 문서, 데이터베이스, 업무 프로세스까지 통할하는 차세대 AI 데이터 인프라로 발전시켜, 글로벌 시장에서 ‘팔란티어 파운드리’와 당당히 경쟁할 수 있는 세계 최고 수준의 글로벌 데이터 플랫폼으로 성장시키겠다”고 설명했다.