[보일스님이 들려주는 4차 산업혁명 이야기] <33> 선문답하는 인공지능 챗봇①
[보일스님이 들려주는 4차 산업혁명 이야기] <33> 선문답하는 인공지능 챗봇①
  • 보일스님 해인총림 해인사승가대학 학장 대행
  • 승인 2020.04.25 16:15
  • 호수 3577
  • 댓글 0
이 기사를 공유합니다

챗봇, 인간의 고통 완화에 큰 역할 한다
보일스님
보일스님

➲ 비대면 세상과 챗봇

인공지능 로봇이 선문답을 한다면 어떨까. 마치 선어록에 등장하는 선사들이 마치 환생한 것처럼 말이다. 인공지능 로봇은 방황하는 젊은이들이 길을 물어올 때 그들과 대화하면서 고민을 들어주고 삶의 통찰을 전해줄 수 있을 것이다. 이제 인공지능 기술의 비약적 발전으로 인해 인공지능 로봇이 그 선사의 역할을 대신할지도 모르겠다. 다소 황당하게 들릴 수도 있겠다. 하지만 현재 상황을 보자.

최근 신종 코로나바이러스 감염증(코로나19)으로 인해 종전과는 다른 방식으로 회사 업무를 처리하거나 학교 수업이 실시되고 있다. 바이러스의 감염전파 위험성 때문에 직접 얼굴을 마주 보는 상황을 피하기 위한 조치이다. 특히 불특정 다수를 상대하는 서비스 업종은 특히 대안이 절실해진다.

직접 찾아가서 물어보는 것이 아니라 전화 또는 인터넷을 통한 상담을 인공지능 챗봇이 대신하는 방법이 활용되고 있다. 사실 인공지능 챗봇은 어느 사이엔가 이미 우리 일상에 급속도로 파고들었다. 스마트폰에서 탑재된 ‘시리’ 등의 프로그램은 궁금한 것을 알려주거나 일상 대화도 가능하다. 이뿐만이 아니다.

요즘에는 사물인터넷 중 하나인 인공지능 스피커도 인기이다. 각 가정에서 가족 구성원 누구나 자신의 음성을 인식하는 인공지능 스피커에 대고 말을 하면 시키는대로 알아서 해준다. 텔레비전을 켜 달라든지, 기분 전환할 수 있는 음악을 틀어달라든지, 맛집 정보를 알려 주고 대신 예약 전화 연결을 해 줄 수도 있다.

마치 집사처럼 주인의 시중을 들어준다. 어렸을 적 봤던 공상과학 영화에서 나오는 바로 그 미래가 지금 실현되고 있다. 일상 속에서 누구보다도 가까운 곳에서 인간의 크고 작은 의사결정을 도와주고 일정을 관리해 주기까지 한다.

이러한 변화에 발맞추어 전 세계의 여러 선도 기업들도 ‘챗봇’에 주목하기 시작했고 대규모 투자와 개발에 뛰어들고 있다. 그 결과 수많은 ‘챗봇’들이 의료, 패션, 관광, 기상예보 등의 매우 다양한 분야에서 서비스를 제공하고 있다. 이 글에서는 그중에서도 심리치료 ‘챗봇’을 중심으로 그 의미를 살펴보겠다.

불교 전통 속에서 이 심리치료 챗봇에 도움이 될 수 있는 내용을 쉽게 찾아볼 수 있기 때문이다. 심리치료 상담 ‘챗봇’은 그 활용도가 매우 광범위하고 효과적이라는 평가는 받고 있다. 그리고 실질적인 치료 효과를 기대하기 위해서는 언어 구사에 있어서 고도의 정밀도를 있어야 하는 분야이기도 하다.

심리치료 ‘챗봇’의 기술 수준을 보면 인공지능의 언어능력을 가늠해 볼 수 있을 것이다. 이 인공지능 ‘챗봇’ 기술을 불교적 아이디어와 접목해서, 특히 그중에서 선문답이라는 데이터를 심리치료에 활용할 수 있다면, 챗봇은 인간의 고통을 완화하거나 해결하는데, 큰 역할을 할 수 있을 것으로 기대된다. 

➲ 챗봇(Chatbot) 

‘챗봇’이란 인공지능을 이용하여 로봇과 인간이 정보교환이 가능하도록 한 시스템이다. 대화 프로그램을 통해서 상대방의 의도를 예측하고, 상대방이 하고자 하는 행위를 유도하도록 하는 프로그램이다. 챗봇은 챗(chat)과 로봇(robot)의 합성어로서 실제 인간이 직접 응답하는 것이 아니라 소프트웨어가 응답하는 것이다. 여기서 정보교환을 하는 방식은 음성인식뿐만 아니라, 문자로서 주고받는 것도 포함된다.

챗봇에 주목하고 있는 이유는 제4차 산업혁명 시대의 다양한 기술의 발전 중에서도 인공지능의 잠재력을 집약적으로 구현할 수 있는 분야가 바로 ‘챗봇’이기 때문이다. 인공지능 딥 러닝 기술을 통해서 인공지능 자체가 스스로 인간의 언어를 학습한다는 것은 매우 중요한 의미가 있다.

언어 구사 능력이야말로 타 종족과 구별되는 인간, 즉 호모사피엔스 고유의 압도적 능력으로서 인공지능의 발전과정에서 필수적이면서 궁극적인 성취단계인 것이다. 즉 인공지능 챗봇의 언어학습 능력과 구사 능력의 향상은 기술적 난이도만큼이나 곧 인공지능발전의 발전 수준을 보여주는 척도가 된다.

초기에 개발된 챗봇은 낮은 대화 수준을 보이는 정도였으나 인공지능 딥 러닝 기술의 개발로 인해 최근 진화를 거듭하면서 ‘인간다운’ 수준의 대화로 급속도로 발전하고 있다. 결국 인공지능 챗봇은 제4차 산업혁명시대를 이끌어가는 핵심기술이 될 것이다. 그런 이유에서, 인공지능 기술을 탑재한 챗봇 기술 개발에 전 세계의 대기업들이 모두 사활을 걸고 경쟁을 벌이고 있다.

이 경쟁이 치열할 수밖에 없는 이유는 인터넷 발전의 역사가 그러했듯이 ‘승자독식’이 예견되기 때문이다. 방대한 대화 패턴 데이터와 양질의 알고리즘 기술을 축적한 기업이 승자가 될 것이다. 그것을 플랫폼으로 삼아 유니버설 봇이 탄생할 것이며, 사용자와의 대화를 통해 현실 세계의 다양한 정보를 수집하고 또 그 정보를 네트워크상에서 공유하고 다시 사물인터넷(IoT) 기술을 통해 현실 세계로 제공한다.

바로 현실 세계의 정보량과 네트워크 세계의 정보량이 동등해지는 제4차 산업혁명의 전형이며 그 중심에 ‘챗봇’이 자리 잡아 하나의 창구역할을 하게 되는 것이다.

이러한 인공지능 ‘챗봇’의 발전은 데이터 수집을 위한 정보인식의 정밀도의 수준이나 머신러닝 기술과 딥러닝의 발전으로 앞으로 어떤 변화를 가져올지 상상을 뛰어넘을 것으로 예상된다. 그렇다면 미래의 인공지능 ‘챗봇’이 어느 정도까지 발전할 수 있을까. 이 글에서 다루게 될 선문답 알고리즘을 만들고 프로그래밍 하는 수준은 아마도 미래에는 낡은 방식이 될 공산이 크다.

전반적인 인공지능의 고정화된 설계 프레임이 변화될 것이고 인공지능 스스로 정보를 입력하고 사고하게 될 것이다. 그리고 미래의 인공지능 ‘챗봇’의 언어 구사 수준은 축적된 데이터와 알고리즘의 구축을 통해 얻은 지식정보에 의해 결정될 것이다. 
 

초기 인공지능 ‘챗봇’ 개발자들은 어휘습득과 문법 프로그램만 있으면 챗봇 개발을 할 수 있을 것으로 예상했다. 하지만 현실은 그렇지 않았다. 바로 문맥에 따라 의미가 달라지는 언어의 속성이 문제가 된 것이다. 은유와 비유 등으로 이루어진 다양한 문장들 속의 개별단어 의미를 정확히 포착하는 것은 인간처럼 오랜 시간을 들여서 방대한 정보를 습득해야 가능한 것으로 생각되기 때문이다. 그러나 바로 이 지점에서 인공지능 ‘딥러닝’ 기술이 도입되면서 양상은 달라졌다. 챗봇은 사용자가 한 질문의 의미를 이해하고 맥락을 파악하고 유추하면서, 그에 수반하여 사용자의 반응을 토대로 ‘챗봇’ 스스로 답변이 적절했는지를 파악할 수 있게 된다. 출처=www.shutterstock.com
초기 인공지능 ‘챗봇’ 개발자들은 어휘습득과 문법 프로그램만 있으면 챗봇 개발을 할 수 있을 것으로 예상했다. 하지만 현실은 그렇지 않았다. 바로 문맥에 따라 의미가 달라지는 언어의 속성이 문제가 된 것이다. 은유와 비유 등으로 이루어진 다양한 문장들 속의 개별단어 의미를 정확히 포착하는 것은 인간처럼 오랜 시간을 들여서 방대한 정보를 습득해야 가능한 것으로 생각되기 때문이다. 그러나 바로 이 지점에서 인공지능 ‘딥러닝’ 기술이 도입되면서 양상은 달라졌다. 챗봇은 사용자가 한 질문의 의미를 이해하고 맥락을 파악하고 유추하면서, 그에 수반하여 사용자의 반응을 토대로 ‘챗봇’ 스스로 답변이 적절했는지를 파악할 수 있게 된다. 출처=www.shutterstock.com

➲ 인공무능에서 딥러닝으로 

현재 시중에 보급된 챗봇은 일반적인 정형구에 대해 낮은 수준의 답변이 가능한 정도이다. 예를 들자면, 스마트폰을 통해 배달 음식을 주문하려고 할 경우, 주문자 동네에서 가장 맛있고 저렴한 치킨집을 알려달라고 말하면, 검색을 통해 자동화된 패턴으로 최적화된 치킨집을 추천해 주는 시스템이다. 즉 아주 간단한 대화 시나리오만으로도 챗봇은 만들어진다.

그러나 그만큼의 간단한 수준의 역할을 수행할 뿐이다. ‘A라는 질문에 B라고 대답한다’라는 패턴이다. 결국 현재는 ‘인공무능(人工無能)’이 대부분이라고 할 수 있다. 다시 말해 학습 능력이 없는 단순한 프로그램일 뿐이다. 개발자가 특정 상황을 가정하여 예상 가능한 문답을 시뮬레이션해서 프로그래밍으로 실행하는 것이다. 외견상으로는 사용자와 높은 수준의 대화를 하는 것처럼 보이지만 사실은 이미 저장된 데이터를 검색해서 대답해주는 것이다.

초기 인공지능 선구자들의 상상 속에서는 어휘습득과 문법 프로그램만 있으면 간단히 해결될 것으로 예상했지만, 현실은 그렇지가 않았다. 바로 문맥에 따라 의미가 달라지는 언어의 속성이 문제가 된 것이다. 은유와 비유 등으로 이루어진 수많은 다양한 문장들 속의 개별단어 의미를 정확히 포착하는 것은 인간처럼 오랜 시간을 들여서 방대한 정보를 습득해야 가능한 것으로 생각되기 때문이다.

그러나 바로 이 지점에서 인공지능 ‘딥러닝’ 기술이 도입되면서 양상은 달라졌다. 즉 사용자의 질문 의미를 이해하고 맥락을 파악하고 유추하면서, 그에 수반하여 사용자의 반응을 토대로 ‘챗봇’ 스스로의 답변이 적절했는지를 파악한다. 이 대화 패턴을 데이터로 축적해 나가는 자가 학습이 가능해지게 된 것이다.

사용자가 하는 질문의 의미와 맥락을 정확하게 파악하기 위해서는 인지 기술과 방대한 정보량을 기반으로 예측, 자동화된 행동과 언어 최적화 기술이 더욱 요구된다. 이러한 인공지능기술의 발달로 인해 인공지능 ‘챗봇’의 자연어 처리와 구사 능력이 대폭 향상될 수 있었다. 

➲ 인공지능 ‘21세기 세종계획’ 

제4차 산업혁명을 인공지능과 데이터 혁명의 시대라고 정의한다면, 그 인공지능을 활용하기 위해서는 인공지능 자체가 인간의 언어를 알아듣고 또는 인간들처럼 언어로 표현할 수 있는 능력이 매우 중요해진다. 한 마디로 인간과 대화할 수 있는 인공지능 로봇을 만든다고 보면 된다.

그러기 위해서는, 인공지능이 딥러닝을 통해 학습할 수 있는 방대한 언어 데이터가 디지털 형태로 존재해야 한다. 그래서 소위 ‘말뭉치’라는 형태의 어절 단위로 언어를 데이터화시키는 작업이 선행되는 것이다.

‘말뭉치’란 특정 언어를 인공지능이 읽을 수 있는 디지털 형태로 수집하고 분류해 놓은 언어 자료를 말한다. 빅 데이터의 한 유형이라고 할 수 있다. 말뭉치 데이터가 많이 확보되면 특정 단어나 어휘의 사용 빈도를 계산할 수 있고, 이를 통계적으로 또는 공학적으로 분석할 수 있게 된다. 확보된 말뭉치가 많아진다는 것은 데이터가 많아진다는 의미이다. 따라서 인공지능이 이해할 수 있는 자연어의 정확도도 높아진다고 할 수 있다.

각국은 인공지능 딥러닝 기술의 비약적 발전으로 이미 인간의 자연어를 데이터화하는 사업에 박차를 가하고 있다. 자연어를 데이터화하는 사업의 중요성을 간파한 인공지능 선도국들은 빠른 속도록 그 데이터 수집량을 늘려가고 있다.

일본은 150억 어절, 중국은 약 800억 어절, 미국은 무려 3000억 어절을 이미 구축해 놓은 상태이다. 우리나라의 경우, 지난 1998년부터 정부 주도로 ‘21세기 세종계획’을 시작해서 2007년 이후 사업이 중단되었다가 2018년 다시 사업이 재개됐다.

국립국어원에 따르면, 현재 한국어 총 10억 어절 이상의 말뭉치가 구축되어 있다고 전해진다. 여러 경쟁국에 비해 너무나 큰 격차이다. 이 차이는 우리말을 사용하는 인공지능 챗봇 기술이 그만큼 뒤처지게 된다는 의미와도 같다. 이유야 어찌 됐건, 10년 이상의 사업 중단이 안타까울 따름이다.

뒤늦게나마 정부가 이 사업의 중요성을 재인식하고 이제라도 사업을 재개한 것은 그나마 다행스럽다. 현실 세계의 우리말을 세종대왕께서 창제하셨다면, 디지털 세계에서 인공지능으로 활용할 수 있는 우리 ‘말뭉치’를 구축하는 작업은 우리 후손들의 몫일 것이다. 

[불교신문3577호/2020년4월25일자]


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.