2025.04.03 (목)

  • 맑음동두천 15.1℃
  • 맑음강릉 11.8℃
  • 맑음서울 16.1℃
  • 맑음대전 16.0℃
  • 구름조금대구 14.0℃
  • 구름조금울산 12.0℃
  • 구름많음광주 15.4℃
  • 구름조금부산 13.3℃
  • 구름많음고창 12.0℃
  • 흐림제주 12.4℃
  • 구름조금강화 12.8℃
  • 맑음보은 14.0℃
  • 구름많음금산 15.3℃
  • 구름많음강진군 15.0℃
  • 맑음경주시 13.1℃
  • 구름조금거제 14.3℃
기상청 제공

기고

인공지능이 이뤄낸 단백질 연구의 혁명

이주호 농업연구사 (농촌진흥청 식물소재바이오공학과)

2024년 노벨상의 화두는 인공지능(AI)이었다. 노벨 물리학상과 화학상 모두 기초연구가 아닌, 인공지능을 연구했거나 응용해 도구를 설계한 과학자들이 수상했다. 특히 노벨 화학상은 단백질 설계 도구인 로제타폴드를 개발한 미국 워싱턴대의 데이비드 베이커 교수와 단백질 구조 예측 도구인 알파폴드를 개발한 구글 딥마인드 CEO 데미스 허사비스, 연구원 존 점퍼에게 수여됐다.


단백질은 인간의 신체를 구성하는 필수요소로 생명 현상의 모든 과정에 관여한다. 소화할 때 필요한 소화효소, 면역 반응에 관여하는 항체, 세포 내의 다양한 화학반응 등이 그 예다.


구조에 따라 단백질은 1차부터 4차 구조까지 분류된다. 1차 구조는 아미노산이 일렬로 배열된, 가장 간단한 형태다. 1차 구조가 펩타이드 결합으로 알파 나선, 베타 병풍 구조를 이룬 것이 2차 구조다. 3차 구조는 아미노산 간의 상호작용으로 구성되며, 단백질 각각의 3차원 구조라 할 수 있다. 두 개 이상의 3차 구조가 모여 만들어진 거대 분자 구조를 4차 구조라 한다.


생체 내에서 단백질-단백질 간의 상호작용은 마치 자물쇠-열쇠처럼 이뤄지기 때문에 각각의 단백질 3차 구조가 중요하다. 따라서 단백질의 3차 구조를 밝힌다면 그 단백질이 수행하는 기능을 이해할 수 있어 수십 년 전부터 중요성을 인정받았다. X선, 핵자기공명법, 극저온 전자현미경 등을 활용해 단백질의 3차 구조를 밝힌 연구는 모두 노벨상을 받았으며, 이들은 현재까지 연구 현장에서 널리 쓰이고 있다. 그러나 이러한 기술의 발달에도 아미노산이 수백에서 수천 개 이상 꼬이고 접혀 만들어진 단백질의 구조를 밝히는 일은 변수가 많아서 쉽지 않다.


앞서 언급한 알파폴드는 기존의 단백질 구조 데이터베이스를 이용해 개발된 3차원 구조 예측 프로그램이다. 2018년 첫 버전이 공개된 이후, 지속해서 연구 결과를 업데이트하며 2021년 알파포드2, 2024년 알파포드3을 발표했다. 알파포드2는 기존보다 예측 정확도가 60~90% 높아졌으며, 알파포드3은 단백질뿐만 아니라 신체를 구성하는 대부분의 분자 물질 구조를 예측할 수 있다.


현재까지 200만 명 이상의 연구자가 알파폴드로 예측한 단백질 구조는 2억 개에 달한다. 전통적인 방법으로 분석하면 수천 년이 걸릴 일이 10년도 채 걸리지 않았다. 로제타폴드 또한 기존 단백질 설계 프로그램인 로제타에 인공지능 기술을 접목해 개발한 구조 예측 프로그램으로 수 분 내로 단백질 구조를 해독하거나 비단백질 화합물까지 원하는 대로 설계, 예측할 수 있다. 더 나아가 핵산 등 생체 분자와 단백질 간의 상호작용을 예측하는 수준까지 진화하여 신약 개발에 큰 전환점이 되었다.


이렇듯 인공지능을 이용한 단백질 구조 예측‧설계 기술은 신약 개발뿐만 아니라 나노소재, 산업용 효소 등 고부가 기능성 물질 개발에도 큰 도움이 된다. 생산하고자 하는 단백질의 구조를 먼저 파악하고 인공지능 기술로 그 구조에 해당하는 단백질의 서열 정보를 도출한 후 합성하면 인공 단백질을 생산할 수 있는 것이다.


물론 해결해야 할 과제도 있다. 이렇게 생산된 단백질이 인체 내에서 어떻게 상호작용하는지 고려해야 하고, 임상 시험 등 인공지능으로 해결하기 어려운 부분들은 실험으로 검증해야 한다. 이와 관련된 대규모 데이터가 축적되고 장기적인 투자가 수반된다면 혁신적인 신약 개발에 한 걸음 더 성큼 다가갈 수 있을 것이다.