본문 바로가기
Eye On A.I.

딥마인드의 혁신으로 부터 얻은 교훈들

by 브래드(Brad) 2020. 12. 6.

출처: DeepMind 홈페이지

 

이번 주 AI 분야에서 가장 큰 소식은 딥마인드 사의 단백질 합성에 대한 혁신입니다.

 

50년 넘게 과학자들의 염원이 되었던 질문, "단백질의 3차원적 형상을 정확하게 예측하기 위해 단백질의 유전적인 서열을 어떻게 이용할 것인가"에 대해 딥마인드의 인공지능 시스템이 효과적인 답을 내놓았습니다. 이로서 다양한 경우에 대해 원자 크기 정도 폭의 정확도로 단백질 구조를 예측할 수 있게 되었습니다.

 

필자는 월요일 발표 당시 딥마인드의 단백질 합성 팀과 심층 인터뷰를 했으며, 런던베이스의 이 인공지능 회사가 어떻게 이런 성과를 달성할 수 있었는지 다소 정확한 기사를 남겨두었습니다. 그 기사에서는 어떻게 "알파폴드 2"라고 불리는 인공지능 시스템이 COVID-19에 대항하며 공헌하고 있는지에 대해서도 밝힌 바 있습니다.

 

오늘 필자는 딥마인드사의 알파폴드2 성공 사례로부터 어느 기업이나 적용 가능한 인공지능 시스템 구축에 관한 교훈을 집중 조명하려 합니다.

 

  • "기성품(Off-the-shelf)"의 인공지능은 한계가 있다(딱 거기까지만 이다).

    2년 전 딥마인드 사는 단백질 구조를 예측하기 위해 새로운 인공지능 시스템을 만들어냈습니다. 기존의 알파폴드(알파폴드 1.0)는 꽤 괜찮았지만 생물학자나 의학연구자들에게는 충분할 만큼 좋진 않았다고 합니다.

    딥마인드의 단백질 합성 팀을 이끈 수석연구원 John Jumper는 기존 알파폴드는 상대적으로 기존에 존재하는 신경망 기술을 활용했으며, 당시 표준 신경망 구조는 이미지의 객체들을 분류하는데 활용되는 것이었다고 합니다. 시스템을 좀 더 개선시켜야 할 때가 닥쳤을 때, "우리는 이 기존 기술이 가지고 있던 한계의 벽에 부딪혔습니다."라고 말했습니다"

    더 나은 성능을 얻기 위해 딥마인드는 다시 처음으로 돌아가 칠판앞에서서 당시 문제들을 돌파할 수 있는 신경망을 새로 그려봤습니다. 그러다 보니 다시 기초적인 질문으로 돌아오게 되었습니다. "설루션은 어떤 모습이어야 하는가? 그리고 우리는 그것의 주변에 있지 않고 신경망에 어떻게 집어넣어야 하는가?"라는 질문이었습니다.

    이것은 기업들이 명심해야할 중요한 교훈입니다. 특히 외부 공급자나 이미 구현된 인공지능 요소들을 활용하려 하는 경우는 더욱 그러합니다.
  • 총체적인(End-to-End) 시스템이 여러 가지를 조합한 것보다 낫다.

    2018년도의 알파폴드는 여러 요소들을 조합해놓은 형태였습니다: 어떤 신경망은 단백질 내부의 아미노 산간의 거리를 예측하기 위한 것이었고, 또 어떤 것은 그들 사이의 가장 유사한 각도를 결정해주기 위한 것이었으며, 또 어떤 것은 전체적인 구조를 정제하기 위한 것이었습니다. 반면, 알파폴드 2는 "End-to-End" 시스템으로 알려져 있는데, 이것은 유전정보를 입력으로 넣어주면 곧장 출력으로 3차원 구조를 얻게 해 줍니다. 이는 end-to-end 시스템이 성능적으로 우위에 있다는 장점을 상기시켜주는 교훈이라 할 수 있습니다.

  • ... 그러나 "신뢰도"에 대한 요소를 무시해서는 안된다.

    그러나 이 end-to-end 방식으로 수행하는 신경망에 있어서 가장 큰 문제는 헤아리기가 너무 어렵다는 것입니다. 그것이 가진 불투명성은 사람들이 이 소프트웨어를 신뢰하기 어렵게 만듭니다.   

    사실 이 문제의 이유로 2018년도에 딥마인드 사가 50가지 다양한 시각을 헤치는 질병들을 진단하기 위해 만든 인공지능 시스템이 두 가지 서로 다른 신경망을 사용하게 됩니다. 하나는 스캐너로 수집된 데이터로부터 질병 행태로 변환해주는 일을 수행하고, 하나는 진단을 내리는 일을 했습니다. 이 분리된 시스템은 인간 의사들에게 진단시스템이 어떤 식으로 결정을 내리는지에 대한 영감을 주었습니다.

    알파폴드 2의 경우에서 딥마인드 사는 예측 정확도에 대한 잣대를 만드는 대신 알파폴드 2가 어떤 이유로 각각의 단백질 구조에 대해 정확하다고 할 수 있는지에 대해 질문하고 있습니다. 정확도는 왜 알파폴드 2가 그 구조를 예측하게 되었는지를 설명하지 못하지만 생물학자들과 의학연구자들에게는 언제 이런 예측을 신뢰할 수 있는지 아니면 언제 이 시스템을 좀 더 비관적으로 다뤄야 하는지에 대한 감각을 심어주게 됩니다. 


  • 해당 분야의 전문성 문제

    딥마인드는 오랜기간 분자생물학 연구실이 단백질 합성구조를 연구하는 데에 엉망 칭창이었다고 합니다. 일부 원인으로 이런 형태의 학술적인 연구소는 단백질 구조를 깊이 이해하는 사람들로는 가득 차 있으나 이들이 컴퓨터 과학자는 아니기 때문이라고 합니다. 딥마인드는  상당한 수준의 머신러닝 전문가와 엔지니어링 자원들을 보유하고 있습니다. 그러나 그들은 거꾸로 단백질 구조 전문가들로부터의 요구사항들을 필요로 했습니다. "우리는 언제나 분야 전문가들과 협업을 해왔습니다."라고 딥마인드의 공동창업자이자 CEO인 Demis Hassabis 가 말했습니다. 그래서 딥마인드는 Jumper와 같은 전문가들을 직접 채용하기도 했습니다.


  • 그러나 역시 다양한 팀이 필요하다.

    딥마인드는 또한 다양한 과학적 지식배경을 가진 팀원들을 보유하고 있습니다. 이 다양성은 매우 유용하기까지 해서 딥마인드의 Science 부문을 맡고 있는 Pushmeet Kohli는 때때로 해당 분야에 있는 사람들이 놓치기 쉬운 실수를 잡아낼 수 있도록 분야 밖에서 온 사람들이 인사이트를 제공하기도 한다 합니다.

    다양한 팀이 작동하기 위해 중요한 것이라면? 그것은 "존중(Respect)"입니다. Kohli 씨는 "사람들이 공헌하는 모든 다양한 방식과 이런 사람들이 가지고 있는 다양한 인사이트들에 대해 존중해주는 것" 이라고 말합니다. 

    Kohli 씨는 "그러나 각각의 사람들이 그들의 목적은 문제를 해결하는 것이지 문제를 해결하는 각각의 방식을 증명하는 것이 아니라는 중요한 사실을 놓치지 말아야합니다"라고 말합니다. "해결하려는 문제가 가장 중요한 것이며 모든 사람들은 각기 그들만의 다른 방식으로 설루션에 접근하고 있습니다." 


  • 한 가지 "모드"만 시도해서는 안된다.

    알파폴드 2에 참여 중인 연구원들은 그들이 여러 차례 난관에 봉착했었으며 그들이 기존에 하던 방식으로는 앞으로 나아갈 수 없었다고 밝혔습니다. 그런 순간마다 Hassabis는 두 가지의 다른 모드에서 전환을 검토해야 할 때라고 말합니다. 첫 번째는 "Strike mode"라고 부르며 이것은 기존 방식으로 팀이 최대한 성과를 내도록 밀어붙이는 방식입니다. 그러나 이런 방식이 작동되지 않는다면, 그는 "Creative mode"로 전환할 중요한 순간이라고 말합니다. 이러한 방식에서 Hassabis는 더 이상 팀을 압박해서 성과를 내려하지 않습니다. 이때 그는 인내를 가져야 하며 심지어 일시적인 퇴보를 예상할 수도 있지만 그는 팀이 좀 더 폭넓고 다양하게 접근하도록 독려합니다. "사람들이 많은 미친 생각들을 최대한 내어놓도록 독려해야 합니다. 브레인스토밍이죠"

    어떤 사람들은 두가지 모드 모두 잘 적응하는 사람도 있지만 어떤 사람은 한 가지 스타일에서만 편안함을 느끼는 부류도 있습니다. Hassabis는 이런 것을 인식하는 것이 매우 중요하다고 말하며, 항상 팀의 상황과 분위기를 바꿀 수 있도록 준비하고 사람들이 새로운 아이디어를 낼 수 있도록 해주며 사람들이 특정한 모드에 잘 적응할 수 있도록 해야 한다고 합니다.

 

원문: Lessons from DeepMind's breakthrough in protein-folding A.I: Eye On A.I. by Jeremy Kahn(Fortune)

 

youtu.be/gg7WjuFs8F4

AlphaFold: The making of a scientific breakthrough

 

댓글