지난주 올해 노벨상 수상자들이 발표됐습니다. 국내에서는 노벨 문학상에 ‘한강’ 작가가 선정되며 크게 화제가 됐는데요. AI 학계에서도 깜짝 놀랄 소식이 발표됐습니다. 바로 노벨물리학상과 노벨화학상에 AI 연구자 제프리 힌튼과 데미스 허사비스 등이 선정됐기 때문입니다. 이번 수상으로 확실히 현대 AI 연구의 영향력을 실감할 수 있었습니다.
데미스 허사비스는 DeepMind 시절부터 AlphaFold 연구를 주도하며 생명 공학계에 판도를 바꿨다는 평가를 받고 있습니다. 그는 현재 Google DeepMind의 CEO인데요. 연구자이면서 동시에 한 기업의 대표인 것입니다. 때문에 해당 연구에 대한 실용적인 성과를 기준으로 인정 받은 것이라고 볼 수 있습니다.
출처: YouTube ‘Nobel Prize’ <First Reactions | Geoffrey Hinton, Nobel Prize in Physics 2024 | Telephone interview>
한편 제프리 힌튼의 수상은 AI 기초 연구에 대한 세계적인 인정으로 봅니다. 그가 AI를 연구한 지 무려 50년 가까이 되는데요. 실용 학문이라는 이름에 가려져 기초 과학에 대한 연구로서 대의적인 명분은 약했습니다. 그러나 올해 노벨물리학상 수상자로 선정되며 ‘물리학적 도구를 이용해 현재의 강력한 ML 기초 방법론을 개발했다’는 사유와 함께 공로를 인정 받은 것입니다.
그렇다면 제프리 힌튼의 제안한 ‘ML의 기초 방법론’은 무엇일까요? 노벨문학상을 수상한 한강 작가의 책이 궁금해 읽어보는 것처럼, 도대체 어떤 논문이 노벨물리학상을 받게 만들었는지 궁금했는데요. 이번 뉴스레터에서는 노벨 물리학상을 수상한 제프리 힌튼의 연구 성과를 중심으로 그가 딥러닝 발전에 기여한 공로에는 어떤 것들이 있는지 살펴보겠습니다.
제프리 힌튼에 대하여
제프리 힌튼은 이른바 ‘딥러닝의 대부’로 불리며 인공지능(AI) 분야에서 가장 영향력 있는 학자로 손꼽힙니다. 영국에서 태어난 그는 인지심리학과 컴퓨터 과학을 연구하며, AI의 현대적 토대를 다졌습니다. 특히 AI의 겨울로 평가 받는 1980년대 역전파 알고리즘을 개발하며 신경망 학습의 돌파구를 마련했습니다.
이후에도 힌튼은 이미지 인식과 음성 인식 등 다양한 분야에서 딥러닝 기술 발전에 지대한 공을 세웠습니다. 캐나다 토론토 대학교에서 학생들을 지도하며, 알렉스 크리체프스키와 일야 수츠케버와 함께 ‘AlexNet’을 개발해 이미지 인식 분야에서 딥러닝 활용을 보편화하기도 했죠. 그의 제자들이 현대 딥러닝의 기초를 닦는 데 큰 기여를 한 것입니다. 비록 그는 2023년 AI 기술의 위험성을 경고하며 Google에서 사임했지만 여전히 큰 영향력을 미치고 있습니다.
역전파 알고리즘(Backpropagation)의 재발견
딥러닝의 목표는 최종 출력값과 예측하려는 값의 차이를 줄이는 것입니다. 그리고 이를 위해서 우리는 ‘역전파’를 사용하죠. 제프리 힌튼의 가장 큰 업적 중 하나는 신경망 학습에서 역전파(Backpropagation) 알고리즘을 재발견하고 이를 발전시킨 것입니다.
그의 아이디어는 ‘각 가중치가 오차에 미치는 영향을 계산’하자는 것입니다. 오차를 많이 발생시키는 가중치에 대해서 올바른 방향으로 조정하는 데 편미분 값을 활용하는 방식입니다. 이를 쉽게 풀어 설명하면, 이미 예측을 잘하는 가중치들은 적게 변화시키고 반면 예측 성능을 떨어뜨리는 가중치는 크게 변화를 주는 것입니다.
과학 최고 저널 ‘네이처’에 실린 이 논문은 딥러닝 입문을 위한 기본적인 개념과 이론을 다루고 있는데요. 논문에서 설명한 이론적 배경은 현대에 와서도 크게 달라지지 않았습니다. 그만큼 딥러닝 발전을 위한 초석을 잘 닦아두었다는 것이죠.
출처: <Learning representations by back-propagating errors> (David E. Rumelhart, Geoffrey E. Hintont & Ronald J. Williams, 1986)
당시에는 입력과 출력 사이를 표현(Representation)할 수 있는 가중치를 찾는 것이 핵심이었습니다. 그리고 이런 표현 속에서 ‘대칭성’을 감지하기 위해 은닉층(Hidden Unit)을 활용했습니다. 데이터의 대칭성을 탐지하는 것은 당시 기준으로 중요한 문제였습니다. 입력 벡터의 중간점을 기준으로 가중치가 대칭적으로 설정되면, 대칭 패턴과 비대칭 패턴을 구분하는 데 필요한 계산이 간소화됩니다. 대칭 패턴이 들어올 때 은닉 유닛들이 모두 꺼지고, 출력 유닛만 켜지는 구조이기 때문입니다.
다양한 대칭 및 비대칭 패턴에서 고유한 활성화 신호를 만들기 위해 가중치가 1:2:4의 비율로 설정했습니다. 이 비율 덕분에 입력 벡터의 대칭적 구조가 아닌 경우, 가중치 합계가 균형을 맞출 수 없으므로 비대칭 패턴을 더 쉽게 감지할 수 있습니다. 이런 아이디어가 현재 아키텍처에 뚜렷이 반영되어 있는 것은 아닙니다. 하지만 당시 데이터에 가지고 있던 대칭적 또는 비대칭적 특징을 추출하겠다는 아이디어가 현대에도 유효하다는 것은 이 연구가 얼마나 대단한 연구인지 알 수 있는 대목입니다.
힌튼은 앞서 역전파를 제안하기 이전에 1985년 테런스 세지노프스키(Terrence Sejnowski)와 함께 <A learning algorithm for Boltzmann machines>라는 논문을 발표했습니다. 그들은 논문에서 기본적인 병렬적 네트워크(Parallel Network) 효과를 기반으로 ‘약한’ 만족 제한을 충족시키는 볼츠만 머신(Boltzmann Machine)을 제안했습니다. 과거에는 정확하게 모든 답을 예측하는 하나의 모델을 추구했다면 볼츠만 머신은 그틀을 깬 것입니다.
볼츠만 머신은 일반적으로 비지도 학습에 많이 사용됩니다. 여기서 비지도 학습이란 정답(Label)이 없는 데이터에서 중요한 패턴을 찾아내는 학습 방식을 말합니다. 이는 데이터에서 특성(Feature)을 추출하는 과정에서 매우 유용합니다. 하지만 전통적인 볼츠만 머신은 계산적으로 매우 복잡하고, 신경망의 모든 유닛이 상호 연결되어 있어 학습 과정이 느리다는 단점이 있었습니다. 이를 해결하기 위해 제한된 볼츠만 머신(Restricted Boltzmann Machines, RBMs)이 등장하게 되었습니다.
출처: <An Online Method for Supporting and Monitoring Repetitive Physical Activities Based on Restricted Boltzmann Machines> (Alencar et al., 2023)
어디서 많이 본 익숙한 그림이지 않나요? 현대 완전 연결 계층(Fully-Connected Layer)과 상당히 닮아 있는 모습입니다. 제한된 볼츠만 머신은 볼츠만 머신의 일종으로, 입력층에 해당하는 가시 유닛(Visible Unit)과 가중치 표현 영역에 해당하는 은닉 유닛(Hidden Unit) 간의 연결만 허용하고, 같은 층 내의 유닛들끼리는 연결되지 않는 구조로 설계되었습니다. 이를 통해 학습과 추론의 계산 복잡도가 크게 줄어들어 보다 효율적인 학습이 가능해졌습니다.
RBM은 제프리 힌튼의 또 다른 중요한 업적인 ‘딥 빌리프 네트워크(DBN)’의 기본 구성 요소가 됩니다. 2006년에 발표된 논문 <A fast learning algorithm for deep belief nets>에서 힌튼은 여러 층의 RBM을 쌓아 올린 DBN을 제안했습니다. DBN은 깊은 신경망 구조로, 각 층이 비지도 학습을 통해 입력 데이터를 표현하고, 그 위에 있는 층들이 점진적으로 더 추상적인 표현을 학습하게 됩니다. 이 구조는 현재 심층 신경망(DNN) 구조 초기 발전에 중요한 역할을 했습니다.
이렇게 제프리 힌튼의 딥러닝을 위한 기초 연구를 한 번 알아봤습니다. 개인적으로 제프리 힌튼의 개인사를 찾아보면서 흥미롭게 생각했습니다. 그는 대입 초기에 철학과 예술에 몰두했고 특히 그중에서도 언어 철학에 큰 관심을 보였다고 합니다. 이 점에서 ‘철학은 근본적인 질문을 던지는 것을 가르쳐줬고, 수학과 프로그래밍은 그 해답을 찾는 도구가 되어주었다’고 말합니다. 마음의 작용을 알기 위해서는 뇌의 작용을 이해해야 한다는 그의 생각은 사실상 그의 관심사는 딥러닝보다도 인간 그 자체에 있었다고 볼 수 있지 않을까 싶은데요.
인간과 세상의 본질을 꿰뚫고자 했던 그였기에, 명석한 두뇌가 더해져 이와 같이 훌륭한 연구 성과를 올릴 수 있었다고 생각합니다. 이제는 AI가 인류의 문화를 뒤바꿔 놓고 있습니다. 제프리 힌튼은 점차 AI 분야의 거인의 되어가고 있습니다.