언어 모델(Language)의 미래는 세계 모델(World Model)?

현재 가장 유명한 인공지능은 ‘언어 모델’(Language Model)이다. 여기서 ‘모델’이란 중핵(core) 프로그램이라고 이해하면 무난하다. 즉, ‘언어 모델’이라 함은 중핵에 ‘언어’가 있다는 의미다. 챗GPT, 클로드, 제미니, 하이퍼클로바X 등이 이에 속한다. 여기에 ‘텍스트+X’의 짝짓기 형태로 확장한 것이 ‘멀티모달’(multi-moda)이다. 모드(mode) 혹은 모달리티(modality)가 여럿이라는 뜻이다(가령 텍스트+이미지, 텍스트+소리, 텍스트+코드 등이 엮여 있다). 얀 르쿤은 ‘언어 모델’은 한계가 분명하다고 말한다. 언어는 세계의 …
Read More

인공지능이 색을 이해하고 구별할 수 있을까?

인공지능이 색을 이해하고 구별할 수 있을까? 말도 안 되는 질문이라 생각할지도 모른다. 하지만 내 직관에 따르면, 인공지능은 색을 모른다. 색(color)이란 무엇일까? 눈을 통해 입력되는 정보를 뇌에서 처리한 결과다. 따라서 전적으로 주관적인(뇌 안에만 존재하는) 현상이다. 같은 종은 대개 같은 주관적 결과를 얻기 때문에, 종끼리는 간주관적(intersubjective) 수준에서 색에 대한 공통감(common sense)을 지니고 있다. 그래서 색에 대해 대화하는 …
Read More

결국 집단이 거의 전부다 : 누구랑 밥 먹느냐가 관건이다

집단이 왜 중요할까? 인간은 종(種) 수준에서부터 철두철미 사회적 존재기 때문이다. 프랑스의 고인류학자, 인류학자, 선사학자인 앙드레 르구아구랑(André Leroi-Gourhan)의 《손놀림과 말 》 연작(1964~65)은 이 점을 잘 보여준다. (이 중요한 사상가에 대해서는 내가 논문을 한 편 썼다.) 인간은 종, 기술, 사회(혹은 민족) 측면에서 각각 해명될 수 있다고 르루아구랑은 주장한다. 기술과 언어활동과 예술은 각 층위에서 중요한 역할을 한다. 각설하고, …
Read More

관찰과 느낌의 차이 (움베르토 마투라나를 읽기 위한 자세)

보는 것, 더 정확히 말하면 관찰하는 것은 관찰자 바깥에서 일어나는 일에 대한 진술이다. 관찰자 안에서 일어나는 일은 느낌이다. 또한 느낌은 바깥에서 일어나는 일에 대한 주관적 해석을 포함한다. 따라서 느낌은 바깥에서 시작할지라도 안에서 완성된다. 종의 진화 과정에서, 또 개인 체험의 역사 속에서, 느낌은 바깥과 안의 ‘짝짓기(coupling)’의 결과다. 몸 바깥에 있는 것들에 대해서는 얼마간 객관적인 입장을 취할 …
Read More