대상을 오류 없이 보려는
딥러닝 작동원리와 구조
인간의 마음과 매우 유사

보일스님

➲ 심층마음

누구나 삶을 살아가다 보면 중요한 선택의 순간이 온다. 사람들은 그럴 때마다 이 말을 종종 사용한다. 깊게 생각하면 실수나 오류를 줄일 수 있다는 경험에서 우러난 믿음이다. 물론 깊이 생각한다고 해서 항상 정답이 나오는 건 아니다. 어려워했던 건 ‘딥러닝’ 연구자들도 마찬가지였다. 입력층과 출력층 사이에 중간층수를 그저 쌓아 올리기만 한다고 해서 정확한 대답이 나오는 것이 아니었다.

그래서 연구자들은 층수의 깊이 또는 높이는 더해가되 중간층마다 데이터나 연산단계를 줄이는 방식을 채택했다. 인공지능이 학습할 때 일부러 데이터에 딱 들어맞지 않게 하는 것이다. 한 마디로 적당히 여지를 남겨두는 것이다. 그렇게 함으로써, 인공지능이 스스로 학습하게 했다. 이것이 바로 여러 단계의 계층적 처리를 반복하여 정밀한 판단을 할 수 있도록 하는 인공지능 기술, ‘딥러닝’이다. 

이 기법은 인공지능 개발 역사에서 획기적이다. 하지만 새로운 기술은 아니다. 이미 개발은 1940년대 무렵부터 시작됐지만, 항상 제자리걸음이었다. 그 이유는 크게 두 가지로 요약된다. 첫째 당시에는 컴퓨터 계산능력이 현재와는 비교할 수 없을 정도로 낮았다. 둘째는 방대한 데이터의 수집이 어려웠기 때문이다. 현재는 이 두 가지가 갖추어졌기 때문에 ‘딥러닝’ 기술이 실현될 수 있었다.

앞서 비로자나불의 예에서 설명했듯이, ‘딥러닝’은 인공지능 스스로 일정 범주의 데이터를 바탕으로 공통된 특징을 끌어내는 방식을 채택하고 있다. 인간이 직접 특징을 도출할 수 있게 설계하는 것이 아니라 인공지능이 다단계로 높은 차원의 특징을 도출해내고, 그 특징으로 각각의 이미지를 분류하는 것이다. 예를 들어, 구글의 ‘고양이 얼굴인식 연구’ 사례를 살펴보자.

데이터 확보를 위해 일단 ‘유튜브’에서 많은 양의 이미지를 가져와서 ‘딥러닝’을 작동시키면, 컴퓨터가 스스로 그 대상들의 공통된 특징을 찾아냈다. 이를 통해 ‘인간의 얼굴’과 ‘고양이의 얼굴’이라는 개념을 획득하게 된다. 이 연구에서는 1000만 장의 이미지가 사용되었다. 이를 위해서 뉴런끼리의 관계 수가 100억 개라는 거대한 인공신경망(ANN, Artificial Neural Network)을 사용했다. 그리고 1000대의 컴퓨터를 3일 동안 가동해야 했다. 방대한 데이터와 높은 수준의 컴퓨팅 능력이 갖추어졌기에 가능한 일이었다. 

➲ 알고리즘보다 데이터

현재는 구글에 인수되었지만, ‘알파고’를 처음 만든 회사가 ‘딥마인드(Deep-Mind)’이다. 회사이름부터가 예사롭지 않다. 벌써 ‘하사비스(Demis Hassabis)’의 야심찬 구상이 보이지 않는가. 알파고를 만든 이 젊은 천재는 인간의 두뇌 구조에 착안한 ‘딥러닝’기술을 혁신적으로 발전시켰다.

딥러닝은 우리말로는 ‘심층 마음 또는 심층 학습’ 정도로 번역되고 있다. 여기서 심층은 즉 층수를 깊이 쌓아가는 것을 의미한다. 바로 인간 두뇌의 생김새가 겹친 채로 포개져 있는 모양을 모방한 것이다. 딥러닝은 세상에 대한 정보나 이치 등을 설명하지 않고 그냥 데이터만 입력해주면 기계가 자체 인공신경망 구조를 통해 스스로 학습을 진행해 지능 수준을 높여가는 시스템이다.

일반적인 인공지능 시스템에서는 어떤 문제나 임무를 수행하기 위해서는 알고리즘을 먼저 구축해야 하는데, 딥러닝은 데이터만 있으면 자기가 스스로 알아서 분류하고 알고리즘을 만들어낸다. 여기서 알고리즘이라는 용어가 생소할 수도 있다.

‘알고리즘(Algorithm)’은 컴퓨터가 수행할 작업을 논리적인 순서대로 컴퓨터에 알려 주는 명령어의 집합이다. 예를 들어, 라면을 끓인다고 하자. 라면 수프를 물과 같이 끓이고 면을 넣을지 아니면 물이 끓고 난 후 라면과 수프를 넣을지 또는 계란은 언제 풀어서 넣을지, 파는 언제 넣을지 등의 라면을 만들기 위한 각각의 순서들의 체계이다. 이처럼 딥러닝은 최소한의 알고리즘으로 최대한의 데이터를 활용하는 것이다. 

따라서 딥러닝에서는 알고리즘보다 ‘빅데이터(Big Data)’가 더 중요하다. 데이터라고 하면 고전적으로 숫자를 연상하기 쉬운데, 우리가 인터넷에 올리는 모든 사진, 댓글들이 모두 데이터가 된다. 무엇이든 원하는 것이 있다면 데이터만 입력한다. 그 후에는 딥러닝이 알아서 빅데이터를 재료 삼아 학습알고리즘을 만들어 결과를 도출해 준다.

그러면 딥러닝과 함께 자주 등장하는 용어인 ‘머신러닝(Machine Learning)’은 ‘딥러닝과’ 어떤 차이가 있을까. 기본적으로 ‘머신러닝’과 ‘딥러닝’은 인간이 직접 프로그램을 만들지 않는다는 점은 동일하다. 다만 머신러닝이 입력을 통해 출력을 결정하는 처리를 하는 1단계 구조를 지칭하는 말이라면, ‘딥러닝’은 다단계의 계층적 처리를 한다는 점에 차이가 있다.

한 마디로 딥러닝은 머신러닝의 일종이다. 간단히 정리해 보면, 가장 바깥 원에 크게 인공지능이라는 개념이 존재하고, 그 안에 ‘머신러닝’ 그다음 여러 머신러닝 기술 중에 ‘딥러닝’이 해당한다. 인공지능 > 머신러닝 > 딥러닝 순이라고 보면 된다. 
 

딥러닝은 데이터를 가지고 스스로 여러 단계의 계층적 처리를 거듭하면서 추상화 과정을 거친다. 마치 인간이 전 5식을 통해 수집된 개별적인 자상(自相)들을 제6식에서 공상(共相)으로서 일반화, 추상화시키는 과정과 유사하다. 출처=www.shutterstock.com
딥러닝은 데이터를 가지고 스스로 여러 단계의 계층적 처리를 거듭하면서 추상화 과정을 거친다. 마치 인간이 전 5식을 통해 수집된 개별적인 자상(自相)들을 제6식에서 공상(共相)으로서 일반화, 추상화시키는 과정과 유사하다. 출처=www.shutterstock.com

➲ 딥러닝과 유식(唯識)

유식 전통에서는 인간의 오근에 기반한 감각 능력을 넘어서는 인식능력 즉 ‘사유능력’은 제6근에 의해서 일어난다고 본다. 의(意)는 눈, 귀, 코, 혀, 몸이라는 5근 다음의 제6근으로 지각, 판단, 사유 등의 인식작용을 일으킨다.

즉 제6 의식은 분별하는 식이다. 우리가 색을 보거나 소리를 들을 때, 그것에 호응하는 것은 전(前) 5식인 감각이고, 그것을 인지하는 것이 제6식인 ‘지각’이다. 이 5근에 개별적으로 주어지는 자극들이 색이나 소리 등이다. 이 전 5식의 대상이 되는 개별적인 자체의 상을 ‘자상(自相, sva-laks·an·a, a intrinsic attribute)’이라고 한다. ‘딥러닝’에 입력되는 많은 양의 ‘빅데이터’에 해당한다고 할 수 있다.

차이가 있다면, 모든 입력되는 감각 자료들이 의식되든 의식되지 않든 간에 모두 다 업의 소산이라는 점이다. 각자의 업력 즉 내적 성향에 따라 좋은 감각 대상은 연장 또는 반복시키려 하고 그 반대로 싫은 대상은 기피하려고 한다. 그렇게 선택된 감각 대상들은 입력되고 각각의 자상들은 서로 비교, 대비되고 분류된다. 다 과거에 행한 행위의 결과들이다. 

그다음, 제6식에서는 그 자상들의 상호 간의 공통적 모습을 끌어낸다. 그것은 일반적이고 추상적인 개념인 공상(共相, sāmāya-laks·an·a, a general attribute)이 된다. 이것은 마치 ‘딥러닝’이 하위 층수에서 비교 분류된 데이터들의 ‘특징값’을 찾아내는 구조와 매우 유사하다.

인간이 외부세계를 경험할 때, 제6식이 도출해낸 공상은 사실 외부세계의 사물과 현상 그대로의 자상을 인지하는 것이 아니라 그 대상에 대한 경험의 공통된 특징이다. 딥러닝이 그러하듯이 그 대상들에 대한 데이터들을 잘 정리하고 분류하여 우리의 지각 세계를 만들어 내는 것이다. 딥러닝에 있어서도 이 특징값의 도출이 가장 중요한 특징이다.

인간들도 외부세계를 민감하게 잘 인지하기 위해서는 사물과 현상에 대한 무수한 감각 경험들이 기억되고 축적되어야 한다. 그러나 인간의 지각 작용은 업의 소산이다. 전 5식에서 개별적 자체의 상들이 제6식에서 업에 따라 집착하면서 욕망의 대상이 되거나 아니면 반감의 대상이 되기도 한다. 이 지각작업은 바로 기억이다. 모두 업에 기반한 추상화 작업이 진행되는 것이다. 그런 다음, 그 데이터들을 비교, 분류, 추상화 작업을 거쳐 개념으로 도출하는 것이다. 우리는 이것을 ‘기억’이라고 부른다.

사실 이 기억은 원래 경험한 감각 자료를 정확하고 정밀하게 반영하지 않는다. 다만 정확하다고 믿는 것일 뿐이다. 객관적 대상 세계를 인식한다고 생각하지만, 사실은 이러한 인식체계의 업에 기반한 추상화 과정에 따라 왜곡되고 변형된 산물이다. 만약 인공지능이 이 추상화 작업을 통한 사물 인식률을 높이는 방법을 찾지 못했다면, 모든 데이터를 다 집어넣고 정확히 일치하는 사물에 대해서만 정답을 찾아 낼 수 있을 것이다. 인간의 두뇌활동 중 감각에서 지각으로 넘어가는 것은 순간에 불과하다.

딥러닝도 애초에 입력층(감각 대상)과 포개진 은닉층을 넘어서 출력층(지각 작용)의 시간을 단축하는 것이 중요한 문제이다. 그러나 일단 속도 이전에 사물을 바로 포착하는 것이 무엇보다 중요하다. 대상을 오류 없이 바로 보는 것 말이다. 느리더라도 바로 보는 것, 바로 수행과 같다. 이처럼 딥러닝의 작동원리와 구조는 인간의 마음과 매우 유사하다. 딥러닝을 알아 가다 보면, 마음이 보이기 시작한다. 

➲ 인간 대 기계?

현재 딥러닝 기술은 이미 인간이 사물을 인식하는 수준을 넘어섰다. 그리고 이제 그 인식된 정보를 추론하는 단계로 진입하고 있다. 이제 남은 숙제는 인공지능 스스로 자신의 행동결과에 대해 예측하고 그 의미를 알아차리는 것이다. 그 의미를 이해한다는 것은 언어와 관련지어 그 대상과 현상을 설명할 수 있게 된다는 의미이다. 그렇게 된다면, 인간과 동등한 수준으로 세상을 인식하고 그를 통해 정보를 습득하고 창의적 작업도 스스로 할 수 있게 된다.

그 창의적 작업에는 인공지능의 독자적인 또 다른 인공지능의 설계도 포함될 수 있다. 물론 미래의 이야기일 수 있지만, 현재에도 딥러닝은 추상화된 판단을 통해 스스로 학습할 수 있다. 그 과정은 알 수가 없다. 어느 수준으로 이 딥러닝이 진화를 거듭할지 현재로선 예측할 뿐이지만, 분명한 건 인간의 개입 여지는 갈수록 줄어들 것이라는 점이다.

‘알파고’의 하루를 인간의 시간 개념으로 환산한다면, 35.7년에 해당한다고 한다. 이 ‘알파고’가 바둑 연습을 한다면 하루에 100만 번의 대국이 가능하다. 이세돌이 아무리 연습벌레라고 해도 그 정도의 노력은 불가능하다. 이러한 인공지능을 인간이 이기려는 시도가 과연 합리적일까.

인간 대 기계라는 경쟁 구도 또는 이분법적 구도에서는 인간이 존재할 여지가 없다. 인공지능은 인공지능일 뿐이다. 어떻게 활용할 것인지, 더 나아가 어떻게 관계 맺을지를 고민해야 할 때이다. 경쟁의 문제가 아닌 관계의 문제이다. 아직 선택은 우리에게 달려있다.  

[불교신문3511호/2019년8월17일자]

저작권자 © 불교신문 무단전재 및 재배포 금지
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음