
디앤디파마텍은 7일(현지시간) 미국 자회사 발테드시퀀싱(Valted Seq)이 인공지능(AI) 기반 싱글셀 유전자 빅데이터 분석 플랫폼 ‘SCADE(Single Cell AI Discovery Engine)’를 공식 출시했다고 8일 밝혔다.
발테드시퀀싱은 존스홉킨스의대에서 보유 중인 환자 뇌 조직에 대한 자체 분석을 통해 세계 최대 규모 수준인 수천만 개 이상의 싱글셀 유전자 데이터베이스를 구축해 왔다.
이번 SCADE 플랫폼 완성을 통해 싱글셀 빅데이터를 더 효율적으로 활용할 수 있게 됐다는 것이 회사측의 설명이다.
싱글셀 유전자 분석은 질병의 원인 규명, 신약 후보물질 발굴, 개인 맞춤형 치료 설계 등에 핵심적으로 활용될 수 있는 큰 잠재력을 지닌 분야다. 그만큼 요구되는 데이터의 양이 매우 방대하고 분석이 까다로운 것으로 알려졌다.
발테드시퀀싱은 싱글셀 유전체 분석에 특화된 GPU 기반 AI 모델을 개발했다. 이후 자체 구축한 수천만개 규모의 고품질 싱글셀 유전자 데이터베이스로 학습시킨 SCADE 플랫폼을 완성했다.
SCADE는 코딩이나 머신러닝(ML) 지식이 없어도 간단한 명령어만으로 복잡한 유전자 데이터를 기존의 AI 기반 기술보다 훨씬 빠르고 정확하게 분석할 수 있도록 설계됐다. SCADE는 지금까지 기술적으로 어려웠던 수천만개의 싱글셀 빅데이터를 빠른시간 내에 분석할 수 있다.
질병의 원인규명 및 신규 신약 타깃 후보물질 발굴에 이용이 가능하다. 또한 뇌 질환, 암, 면역질환 등 목표로 하는 질환에 특화된 정밀 분석 솔루션 개발도 가능할 것으로 회사측은 기대하고 있다.
또한 발테드시퀀싱은 AI 모델 간의 싱글셀 분석기능을 체계적으로 비교 분석할 수 있는 표준화된 평가 모델을 고안해냈다.
이를 기반으로 진행된 비교 시험에서 기존의 다른 AI 분석 도구들은 평가 기준인 ‘분석 코드 실행 성공률’에서 최대 25%, ‘예상 결과와의 정확도’에서 최대 14%에 그쳤다. 반면 SCADE의 경우 ‘분석 코드 실행 성공률’ 96%, ‘예상 결과와의 정확도’ 36%라는 결과를 보였다. 타 기술 대비 최소 2배 이상 향상된 성능이다.
또한 SCADE는 프로그래밍과 관련한 사전지식 없이도 쉽게 사용할 수 있는 서비스 제공을 목표로 하고 있다. 데이터 탐색과 분석, 보고서 자동 생성까지 한 번에 가능하도록 설계됐다.
발테드시퀀싱은 이를 통해 싱글셀 유전자 분석에 있어서 기존 플랫폼이 지닌 한계를 뛰어넘어, 향후 제약 바이오 산업 내에서의 질병 관련 바이오마커 및 신약 후보 물질 발굴, 의료 기관의 환자 맞춤 치료 전략 수립 등에서 실질적인 기여가 가능할 것으로 보인다.
바르디아 네자미(Bardia Nezami) 발테드시퀀싱 CEO는 “현장의 연구자들이 필요로 하는 것은 방대하고 복잡한 유전적 정보를 신속하고 간결하게 분석할 수 있는 도구다”며 “SCADE는 바로 그 기대를 충족시키고자 고안된 새로운 개념의 플랫폼 기술”이라고 말했다.
그는 “수십억개의 싱글셀 유전자 정보로 구성된 빅데이터 분석이 가능한 SCADE 개발을 위해 현재 글로벌 AI 회사와 협업을 논의 중”이라고 덧붙였다.