학부 때 생화학 수업이었던 것 같다. 수업 시간에 교수님은 펩타이드의 시퀀스만 갖고서 단백질의 3차구조를 알아낼 수 있다면 노벨상을 받을 것이라고 했다. 그 정도로 이러한 일은 불가능한 일로 여겨졌다.
몇 주전, 뉴스가 나왔다. 구글에서 개발한 알파폴드가 사람을 비롯한 몇몇 종에 존재하는 모든 단백질의 구조를 전부 예측하고 이를 공개했다는 것이다. 구조 예측대회에서 알파폴드가 우승했다는 뉴스가 작년에 나왔고, 그 사이에 두번째 버전이 만들어지고, 이제는 모든 단백질의 구조를 다 예측하는 수준까지 오게 된 것이다. 물론 여전히 모델링일 뿐이고 실험적으로 구조를 증명한 것은 아니라고 이를 폄하할 수 있을 지 모르지만, 어쩌면 알파폴드등을 비록한 Deep leaning과 AI가 기존의 연구자의 영역까지 침범하게 될 것이라는 두려움이 그런 평가를 하게 했을 수도 있다. 그 만큼 이는 혁명적인 성과임에 틀림이 없다.
그렇다면, 이런 AI가 단지 단백질 구조에만 머물러 있을 까? 그렇지 않을 것이다. 이를 바탕으로 단백질과 단백질 상호작용에 대한 예측. 단백질과 small molecule과의 상호작용에 대한 예측. 예측을 통한 chemical의 design. 특정 chemical이 상호작용 할 수 있는 potential interaction protein에 대한 가상 스크리닝 등, 새로운 연구분야들이 탄생을 할 것으로 예상된다. 큰 제약회사들에서는 이미 이런 신기술을 선점하기 위해 벌써 바쁘게 움직이고 있을 것이다.
AI와 Computational tool은 아마도 가까운 미래에 연구에 있어서 new normal이 될 가능성이 높다. 과거의 신기술이었던 q-PCR등이 이제는 학부 연구생이 가장 먼저 배우는 실험이 되었고, 이제는 RNA-seq도 일상적이 되어 가고 있다. 마찬가지로 현재는 희소성이 존재하는 Computational tool 역시 머지 않아서 더욱 보편적으로 사용되게 될 것 같다. 따라서 연구에 있어서, computational tool을 다룰 수 있는 그룹과 그렇지 않은 그룹의 연구 역량의 격차는 더 커질 것으로 보인다.
AI의 발전에 따른 직접적인 수혜를 보는 사람들은 단기적으로는 아마도 모델링을 하는 사람들, 또 이러한 Tool을 만드는 사람들일 것이다. 그런데 장기적으로는 이러한 방법론도 정형화되고 saturation될 가능성이 있다고 생각한다. 그러면 이런 현실속에서 실험과학이 설자리는 없는 것일까?
오히려 역설적으로 실험 과학은 AI시대에 큰 혜택을 얻을 수 있다. AI의 예측 방법론을 이용하면, 가설을 만드는 과정에서의 시행착오를 줄일 수 있다. 또한 Metadata를 얻게 되었을 때, 이를 AI와 Computational 방법으로 분석을 하게 되면, 더 명확한 기전에 대해 알 수 있다. 따라서 이러한 새로운 방법론을 잘 활용하기만 한다면, 이전보다 더 효율적으로 일하게 될 수 있다.
그리고 장기적으로 계속해서 실험과학은 더 중요해질 수도 있다. 여전히 AI가 할 수 없는 일이 있다. AI는 이미 있는 데이터를 학습하여 새로운 데이터를 분석하고, 예측하는 데 사용될 수는 있겠지만, AI는 새로운 데이터를 만들어내지는 못한다. 펩타이드의 시퀀스를 통한 단백질의 3차구조 예측보다 훨씬 더 복잡한 차원과 변수를 갖고 있는 생명현상에 대한 이해는, 새로운 가설과 독특하게 설계된 실험, 그리고 이를 통해 얻게 되어지는 예상치 못한 결과를 통해, 실험 과학이 계속 끌고 가게 될 것이다. 그렇기 때문에 실험 과학의 중요성이 결코 줄어들지 않을 것이라는 것이 조심스러운 생각이다.
어쨌든, 변화될 환경을 미리 바라보며 방법론을 배우면서 New Normal을 준비하는 것이 지혜로운 자세일 것 같다.