수리과학, 물리학, 화학, 생명과학 분야와 이들을 기반으로 한 융&복합 분야
미래 산업 경쟁력 강화의 근간이 되는 소재 및 ICT 분야
과제 & 연구자
큰 꿈을 향한 무한탐구의 연구열정,
삼성미래기술육성사업이 응원하며 함께 하겠습니다.
우리 몸을 구성하는 세포에는 그 작동 원리를 결정하는 유전물질인 DNA가 있습니다. 수십 년 전만 해도 우리는 DNA에 대한 이해가 부족하여, 세포를 알 수 없는 원리로 작동하는 '미스터리 박스'로 생각했습니다. 하지만 차세대 염기서열 분석(Next Generation Sequencing), 유전자 편집(Genome Engineering) 등의 기술이 빠르게 발전하면서 DNA에 대한 이해가 크게 향상되었습니다. 그 결과, 이제 세포는 DNA라는 정교한 프로그램에 따라 작동하는 기계와 유사하다는 관점이 자리잡게 되었습니다. 이는 매우 중요한 패러다임의 전환을 의미하지만, 여전히 중요한 과제는 남아있습니다. 그것은 바로 “DNA라는 프로그램 언어의 작동 원리를 자세히 이해하는 것”입니다.
예를 들어, 암을 포함한 인간의 유전질환은 DNA 프로그램 코드에 특정 오타가 생기면서 세포가 정상적으로 작동하지 못하게 되는 현상에 비유할 수 있습니다. 현재 세포의 DNA를 분석하여 어떤 부분에 오타가 발생했는지 식별하는 데까지는 도달했지만, 이러한 오타가 구체적으로 어떤 오류를 일으켜 세포의 정상 작동을 방해하는지, 또 이를 어떻게 정상화 할 수 있을지는 아직 제한적으로만 파악된 상태입니다. DNA 프로그램 언어를 완전히 이해한다면, 특정 오타의 영향을 정확히 예상할 수 있지만, 이는 그동안 어려운, 거의 불가능한 목표로 여겨졌습니다. 그러나 최근 두 가지 기술의 획기적인 발전으로 저는 이제 이 목표가 가능해졌다고 믿게 되었습니다. 첫 번째는 유전자 쓰기와 읽기 기술입니다. 유전자 편집과 차세대 염기서열 분석법 덕분에, 세포에 특정 변이(DNA 오타)를 자유롭게 도입하고, 그 결과(프로그램 에러)를 대규모로 관찰할 수 있게 되었습니다. 자연적으로 나타나는 유전 변이에만 의존하지 않고, 인공 변이 세포를 분석하며 정확하고 “방대한 빅데이터를 생성”할 수 있게 된 것입니다. 두 번째는 인공지능 학습의 비약적인 발전입니다. 2024년 노벨 물리·화학상 모두 인공지능과 관련된 분야에서 나온 것처럼, AI는 놀라운 속도로 성장하고 있으며, “빅데이터 학습”을 통해 우리가 아직 알지 못한 규칙과 시스템 작동 원리를 밝혀낼 수 있게 해줍니다.
저희 연구팀은 이 두 가지 기술을 결합하여 DNA 프로그램 언어의 깊이 있는 이해를 목표로 하고 있습니다. 대규모 인공 변이 세포를 통해 방대한 빅데이터를 생성하고, 이를 학습한 인공지능 모델을 구축해 DNA 프로그램 언어를 해독하고, 다양한 유전 변이의 기능을 예측하고자 합니다. 이렇게 구축된 AI 모델은 특정 유전 변이가 세포에 미치는 영향을 예측하는 데 도움을 주고, 이를 통해 유전 질환의 작동 원리를 이해하며, 맞춤형 치료제 개발과 검증에도 효과적으로 활용될 수 있을 것입니다. 궁극적으로, 수많은 유전 변이와 그에 맞는 치료제를 카탈로그화 하여 차세대 의료의 목표인 개인 맞춤형 정밀 의료를 실현할 기반을 다지는 데 기여할 수 있을 것으로 기대합니다.
우리 몸을 구성하는 세포에는 그 작동 원리를 결정하는 유전물질인 DNA가 있습니다. 수십 년 전만 해도 우리는 DNA에 대한 이해가 부족하여, 세포를 알 수 없는 원리로 작동하는 '미스터리 박스'로 생각했습니다. 하지만 차세대 염기서열 분석(Next Generation Sequencing), 유전자 편집(Genome Engineering) 등의 기술이 빠르게 발전하면서 DNA에 대한 이해가 크게 향상되었습니다. 그 결과, 이제 세포는 DNA라는 정교한 프로그램에 따라 작동하는 기계와 유사하다는 관점이 자리잡게 되었습니다. 이는 매우 중요한 패러다임의 전환을 의미하지만, 여전히 중요한 과제는 남아있습니다. 그것은 바로 “DNA라는 프로그램 언어의 작동 원리를 자세히 이해하는 것”입니다. 예를 들어, 암을 포함한 인간의 유전질환은 DNA 프로그램 코드에 특정