2020년 물리학 분야의 저명 학술지인 <Phys. Rev. Lett.>에 상당히 흥미로운 논문이 출판되었다(DOI:10.1103/PhysRevLett.124.010508). 논문의 연구자들은 먼저 지구에서 본 화성과 태양의 위치 정보를 학습 데이터로 이용해서 미래의 두 천체의 위치를 예측하도록 인공지능 신경망을 학습시켰다. 이런 방식으로 입력 데이터를 이용해 인공지능을 학습시키고, 학습한 인공지능이 이후의 미래를 예측하도록 하는 것은 인공지능 분야에서 자주 시도되는 익숙한 유형의 문제다. 흥미로운 것은 논문에서 이용한 신경망의 구조다. 모두 7개의 층으로 신경망을 구성했는데, 딱 중간에 있는 네 번째 층의 노드의 숫자를 몇 개 정도로 크게 줄였다. 입력 데이터에 들어있는 많은 양의 정보는 순차적으로 신경망을 통과하며 처리되다가 노드가 몇 개 없는 이 신경망의 가운데 부분을 통과하면서 일종의 병목 효과로 정보가 크게 단순화할 수밖에 없는 구조다. 천체의 위치를 정확히 예측하도록 학습시킨 다음, 연구자들은 가운데의 병목에 해당하는 네 번째 신경망에서 도대체 어떤 정보가 활용되는지를 살펴봤다. 그 결과가 무척 놀라웠다. 인간이 따로 친절히 가르쳐주지 않았는데도 불구하고, 이 논문의 인공지능이 지구가 아닌 태양에서 본 화성과 지구의 위치를 병목 부문에서 이용한다는 것을 알게 되었다. 인공지능이 천체의 미래 위치를 제대로 예측하려면, 지구가 아닌 태양을 중심으로 한 좌표계를 이용해야 한다는 것을 스스로 찾아낸 셈이다. 이 논문을 소개한 학술지 네이처의 기사(DOI:10.1038/d41586-019-03332-7)가 논문에서 구현한 인공지능을 “AI 코페르니쿠스”라고 부른 이유다. 인간이 발견하기까지 수천 년이 걸린 태양중심설을 이 인공지능은 순식간에 찾아냈다는 생각에, 당시 이 논문을 보고 큰 충격을 받았다.
위에서 소개한 연구 결과는 무척이나 놀랍지만, 논문에서 구현한 인공지능이 일반화의 능력을 갖기는 어렵다. 정확히 같은 꼴의 뉴턴의 중력 법칙을 따르지만, 화성이 아닌 목성의 위치를 예측하도록 하려면 인공지능의 학습을 새로운 데이터를 이용해서 맨 처음부터 다시 수행해야하기 때문이다. 최근 같은 학술지인 Phys. Rev. Lett.에 출판된 논문(DOI: 10.1103/PhysRevLett.131.067301)이 바로 이 문제를 다뤘다. 논문의 제목에 메타학습(meta-learning)이라는 단어가 등장한 이유다.
길이가 제각각 다른 단진자를 예로 들어보자. 우리가 살아가는 일정한 중력장 안에서 단진자의 운동은 딱 하나의 조절변수인 단진자의 길이에만 의존한다. 위치와 속도를 각각 수평축과 수직축으로 해서 정의된 2차원 공간 안에서 단진자의 운동은 궤적을 따라 움직이는 점 하나로 표현된다. 논문에서는 길이가 1, 3, 5, 7, 9미터로 제각각 다른 다섯 개 단진자의 궤적을 학습데이터로 이용했다. 학습의 과정이 기존 연구와 다른 점은, 길이가 달라도 똑같은 형태인 역학적 힘을 인공지능이 일반화해서 배우도록 한 점이다. 단진자의 궤적을 설명하는 중요한 변수가 진자의 길이라는 것을 사람이 따로 알려주지 않아도, 인공지능 스스로 길이에 해당하는 물리적 변수를 학습하게 된다. 다음에는 인공지능이 학습한 적 없는 다른 길이의 진자의 짧은 궤적을 보여주고 이 새로운 진자의 미래를 예측하도록 했다. 이 두 번째 과정에서는 이미 다섯 개의 궤적으로부터 인공지능이 배운 역학적 힘의 형태는 유지하면서, 인공지능이 스스로 중요하다고 찾아낸 물리적 변수만을 조정하는 방법을 택했다. 먼저 다섯 궤적으로 일단 인공지능이 배우고 나면, 배운 적 없는 길이를 가진 진자의 운동을 단 몇 번의 학습만으로도 쉽게 예측하게 된다는 것이 논문의 중요한 결과다. 몇 개의 예를 활용해 인공지능을 잘 가르치면 배우지 않은, 비슷하지만 다른 문제도 빨리 풀 수 있는 일반화의 능력을 보여준다는 의미다.
단진자뿐 아니라, 여러 다른 물리학 문제에 같은 방식의 인공지능을 활용해 얻은 성공적인 결과도 논문에 담겨있다. 단진자의 운동은 진자의 길이라는 물리적 조절변수가 결정하듯이, 논문에 소개된 또 다른 비선형 동역학 모형에는 모두 세 개의 조절변수가 있다. 이 논문에서 이 얘기도 무척 재밌었다. 먼저, 넉넉히 셋보다 많은 다섯 개의 물리적인 변수가 있다고 가정해 인공지능을 학습시키면, 이 인공지능은 최선을 다해서 다섯 개의 변수를 찾아낸다. 다음에는, 이렇게 인공지능이 찾은 다섯 개의 변수 중 실제로 도대체 몇 개가 정말로 중요한지를 찾아내는 표준적인 방법인 ‘주성분 분석’(PCA, Principal component analysis)을 적용한다. 그 결과, 다섯 개가 아닌 딱 세 개의 변수로 대부분을 설명할 수 있다는 결과를 얻을 수 있었다고 논문은 전한다. 상당히 일반적인 형태의 방정식을 상정하고 실제의 데이터를 이용해 논문의 인공지능을 학습시키면, 주어진 데이터를 설명하는 물리적인 조절변수의 개수를 이 인공지능을 이용해 찾아낼 수 있다는 무척 재밌는 결과다.
오늘 소개한 최근 논문의 인공지능은 상당한 수준의 일반화의 능력을 보여준다. 물론 아직 한계는 많다. 단진자의 궤적으로 학습시킨 인공지능은 단진자 문제의 여러 다른 경우로만 일반화가 가능하기 때문이다. 단진자의 역학을 가르쳤더니 100년 뒤 화성의 위치를 알아낼 수 있는 수준의 일반화는 오래 교육받은 인간 물리학자에게서만 찾아볼 수 있다. 아직은.
자연과 우주에서 관찰한 데이터를 이용해서, 이 데이터를 설명하는 이론 모형을 구축하고, 구축된 이론 모형을 새로운 데이터에 적용해 검증한 다음에, 완성된 이론 모형으로 미래를 예측하는 것이 물리학이 오래 해온 일이다. 급격히 발전하고 있는 인공지능이 그리 머지않은 미래에 물리학자를 대체할 가능성을 요즘 난 자주 상상한다. 인간의 이해 없이 정교하게 미래를 예측하는 시대가 올 때까지 어쩌면 그리 긴 시간이 남지 않았을 수도 있다. 이러한 미래의 모습은 물리학자에게 두려울 수도 있지만, 어쩌면 물리학을 크게 발전시키는 데에 기여할 여지도 있다. 수많은 천체 데이터로 학습시킨 인공지능도 암흑물질의 존재를 예측해낼지, 수많은 양자 현상 데이터를 학습한 미래의 인공지능도 우리와 같은 양자역학의 슈뢰딩거 방정식을 찾아낼지, 난 지금 무척이나 궁금하다. 인간이 만든 인공지능이 보여줄 새로운 물리학이 인간이 찾아낸 물리학과 같을까? 지금 우리 인간의 물리학과는 다르게, 하지만 더 정확하게 자연을 그려낼지도 모를 인공지능의 물리학은 어떤 모습일까?