GPT-4o 소감 : 무엇에 쓰는 물건인고?

지난 밤 사이 발표된 GPT-4o가 화제다. 기술에 조금이라도 관심이 있는 사람은 누구나 경탄해 마지않는다. 나도 2013년 영화 HER가 (거의) 실현된 것에 대해 놀라움을 느낀다. 물론 영화 HER의 인공지능 목소리 사만다가 별 놀라움을 주지 않았었다는 소감도 함께 말해야 하리라.

기술은 인간에 복무해야 한다. 물론 인간을 해치는 기술도 무척 많다. 그렇다고 해서 기술의 양면성을 말하는 건 하나 마나 한 소리다. 나는 그토록 많은 돈을 불태우며 기껏 ‘목소리’로 수렴된 이 기술에 의문을 던질 따름이다.

[챗GPT에 1년에 약 70조원을 불태워도 상관없다는 샘 올트먼. 참고로 2024년 대한민국 1년 예산은 656.6조 원임.]

기계와 음성으로 소통하는 일은 기술의 관점에서 놀라운 일이지만, 이것의 효용에 대해 놀라는 것은 놀랍지 않을 수 없다. 물론 음성으로 지시를 내리고, 정보나 조언을 구하는 일은 효용이 크다. 키보드나 터치패드 혹은 마우스 같은 물리 장치를 거치지 않아도 되기 때문이다. 특히 시각 장애인에게 큰 도움이 될 수 있다(주변의 시각 정보를 음성으로 설명해 주니까). 그런데 음성 소통의 효용이 얼마까지 큰지에 대해서는 아주 회의적이다.

이런 평가는 단지 개인의 소견에 기반한 것이 아니다. 미디어의 역사를 보면, 음성, 문자, 인쇄 순으로 발전했고, 후자로 올수록 효용은 커졌다(이와 관련해서는 월터 옹의 《구술문화와 문자문화》, 그리고 내가 쓴 짧은 글 “개체 중심에서 초연결 관계 중심의 사회로”,  《포스트휴먼과 융합 – 5차 산업혁명의 문턱에서》, 한울, 2023)를 참조하면 좋다). 단지 효용이 증가한 것뿐 아니라 실제로 인간의 사고력을 기하급수적으로 증진시켰다. 음성은 기억 용량 및 전달 범위에서 무척 제한적인 반면, 인쇄는 그런 한계를 넘어선 것뿐 아니라 책 몇 권을 늘어놓고 서로 비교하는 병렬 비교와 일반적 참조(어떤 책 몇 쪽에 이런 내용이 있음),  그리고 목차와 색인 등의 장치를 통해 사고와 연구의 폭을 확장했고 공동 지능을 발전시켰다. 이 과정에서 읽기와 쓰기를 포함한 사고 훈련이 증진되었음은 말할 필요도 없으며, 보통 교육을 통해 전 인류에 걸쳐 이런 작업을 동기화(synchronize)할 수 있게 했다.

그런데 GPT-4o는 다시 음성으로 후퇴하는 퇴보를 성취했다! 가끔 기계와 음성으로 소통할 수 있게 되었다고 감동하는 경우도 있던데, 한 번 더 강조하지만, 기술적으로는 놀라운 성취지만 문화적으로는 퇴보임이 분명하다. 이 기술 혹은 이 기술의 더 발전된 버전이 뭔가 큰 쓸모를 입증할 수 있을 때까지는 말이다.

내가 최근에 언어모델 기반 인공지능에 대해 굉장히 회의적인 건, 저 돈을 다른 긴급한 문제를 해결하는 데 써야 한다는 절박함 때문이다. 데미스 하사비스가 시도하는 접근은 언어모델과는 전혀 다르기 때문에 충분히 평가한다(단백질 구조 예측 같은 것). 그밖에도 가성비 좋은 많은 인공지능 기술들은 놀라운 시선으로 존경하고 있다. 다만  수십~수백조 원을 불태우는 언어모델 인공지능이 충분히 쓸모가 있는지는 회의적이다. 나중에 더 자세히 쓸 기회가 있겠지만, 인공지능이 있는 게 아니라 인공지능들이 있다(AI in general doesn’t exist, there are AI’s). 결을 잘 갈라야 엉키지 않을 수 있다.

Comments

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.