컴퓨터가 자연어를 다룬다는 것

컴퓨터에 의한 자연어 처리는 오랜 숙제였다. 이 숙제는 호기심이나 학술적 관심에 앞서 냉전의 요청이었다. 적국의 암호문을 실시간으로 이해할 수 있으면 유리한 고지에 설 수 있었다(가령 영어와 러시아어). 여러 시도가 있었지만, 최초의 이정표는 아마도 딥러닝 기반 ‘구글 신경망 기계 번역(Google Neural Machine Translation)’일 것이다(2016년). 챗GPT는 그 다음의 중요한 성취였다(2022년). 2023년을 달군 챗GPT는 인공지능의 승리라고도 평가된다. 인간의 자연어를 대부분의 인간보다 더 잘 구사하는 능력 앞에서 모두가 경악해야만 했다.

진화적으로 인간의 자연어 구사는 분명 탁월한 능력이다. 언어는 문명의 토대였다. 따라서 컴퓨터가 인간 언어를 잘 처리한다는 사실은 놀라운 일이다. 혹자는 인공지능이 인간을 훌쩍 넘어서는 시점이 머지 않았다고 전망하기도 한다.

하지만 냉정하게 평가해 보자. 우선 자연어를 구사한다는 것의 두세 차원을 구별해야 한다. 월터 옹의 분석을 참조하면, 자연어는 음성(구어)과 문자(문어)로 구분되며, 다시 문자는 필사와 활판 인쇄로 구분된다. 그리고 음성, 필사, 활판 인쇄는 순서대로 진보를 뜻한다. 인간이 음성 단계에 머물렀다면 현재와 같은 문명 건설은 요원했다는 것이다. 즉, 미디어가 진보하면서(단지 달라진 것만은 아니다) 새로운 사고 역량이 발전할 수 있었다는 것이다. 쉽게 말해, 인간의 기억력은 유한하기 때문에 음성만 존재할 때는 리듬에 얹어 암송하는 정도의 지식만 보존되고 전수될 수 있었다. 호메로스의 서사시가 그런 지식의 대표다. 당대에 ‘일리아스’와 ‘오딧세이아’는 문학 작품이기 전에 세상에 대한 지식의 대부분이었다.

문자의 발명은 기억의 증폭을 낳았다. 한 개인 혹은 집단이 어떤 것을 잊어도 다시 상기할 수 있게 된 것이다. 이제 단어의 뜻과 사용법 정도만 기억하면 얼마든지 지식을 늘릴 수 있었다. 나아가 활판 인쇄는 지식의 규격화를 가능하게 했다. 말하자면 여럿이 공유할 수 있는 책자를 통해 참조, 비교, 추가, 색인, 토론 등이 가능해졌다. 사실 필사본으로는 이런 일들이 몹시 제한될 수밖에 없었다. 활판 인쇄가 하이퍼텍스트와 데이터베이스로 바뀌면서 이런 일들은 더 쉬워졌지만, 후자가 활판 인쇄보다 얼마나 더 진보한 것인지에 논란의 여지가 있고(가령 주의 분산, 과정의 생략), 지금은 다루지 않겠다.

하나 더 주목해야 할 지점이 있다. 인간은 자연어 말고도 많은 상징 언어를 발명했다. 예로 수학, 예술, 디지털 같은 것을 꼽을 수 있다. 이런 확장 언어는 자연어를 능가한다. 혹은, 자연어가 품는 것과는 다른 세계를 만나게 해준다. 사실 문명의 바탕에는 자연어와 더불어 이런 확장 언어가 함께 있었다는 점을 간과하면 안 된다. 현대 문명의 근간에 수학이 있다는 점 하나만으로도 이는 명백히 입증된다.

이제 두 가지 질문이 가능하다. 컴퓨터는 확장 언어까지 다룰 수 있는가? 또, 컴퓨터가 자연어를 다루는 층위는 어떤 지점일까?쉽지 않은 물음이다. 컴퓨터의 바탕이 수학인 건 분명하지만, 컴퓨터는 수학에서 근본적인 한계를 지닌다. 가령 고등과학원 물리학부 박권 교수는 이렇게 말한다.

“괴델의 불완전성 정리에 따르면, 모순이 없는 수학 이론은 그 안에 참이면서 증명할 수 없는 명제가 반드시 존재하며, 스스로 자신이 모순이 없다는 것을 증명할 수 없다. 튜링의 ‘정지 문제’(Halting Problem)에 따르면, 수학에는 근본적으로 풀 수 있는지 없는지 판정할 수 없는 문제가 반드시 존재한다. / 괴델과 튜링이 발견한 이러한 수학의 근본적인 문제점은 수학 체계가 그 안에 자기 자신을 포함할 때 발생하는 모순에 기인한다. 비슷하게, 인공지능도 자기 자신이 생각한다는 사실을 지각하게 되면 모순이 발생한다. 아마 인공지능은 이 모순을 피하려 할 것이다. 반면, 인간은 원래 모순을 부둥켜안고 같이 살아갈 수밖에 없는 존재다. 어쩌면 이 차이가 인공지능은 정말 인간처럼 생각할 수 없다는 것을 뜻하는지 모른다.”

또한 컴퓨터는 예술 능력이 없다. 이에 대해서는 내가 집요하게 주장하는 바다(《AI 빅뱅》 참조). 인공지능은 가치를 창조하지 못하고, 자신을 스스로 넘어서지 못한다.

컴퓨터가 다루는 언어의 층위는 단순하지 않지만, 최소한 의식을 지니고 있지 않다는 점은 현재로선 분명해 보인다. 의식의 정의는 다양할 수 있지만, 최소한 ‘자신이 자신을 아는 것’, 즉 자각 혹은 성찰을 의식의 최소 요건으로 보아야 한다는 점은 분명하다. 컴퓨터는 내지를 뿐 자신이 무엇을 하는지 모른다. 아니, ‘자신’이라는 게 애초에 없다. 자기를 돌아보며 내뱉은 말을 수정하기도 하고 더 높은 차원으로 비약하기도 하는 일이 컴퓨터에겐 발견되지 않는다. 컴퓨터의 작업을 보며 그런 일을 하는 건 인간 자신이다.

(Pygmalion Adoring His Statue by Jean Raoux, 1717)

피그말리온은 자신이 만든 조각상 갈라테이아를 사랑했고, 아프로디테는 갈라테이아를 인간 여인으로 변하게 해줬다. 그러나 아프로디테는 인공지능을 인간으로 바꾸지는 않을 것이다.

Comments

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.