한국은 ‘네이버’나 ‘다음’ 같은 국내 포털 사이트가 발달해 있다. 한국에서 10년간 살다 보니 이제는 한 국가에서 활성화된 인터넷 플랫폼이란 개념에 익숙해졌다. 한국을 처음 찾는 외국인에게는 항상 구글맵 대신 한국 지도 애플리케이션(앱) 사용을 권하기도 한다. 이유는 간단하다. 한국 정부가 국가안보 등을 이유로 자세한 지도 데이터 사용을 외국 회사에 허용하지 않기 때문이다. 외국인의 눈에는 보호무역으로 보일 수 있다.
한국 경제의 여러 분야에서 보호무역주의를 접한다. 하지만 외국 상품을 대체할 수 있는 한국 제품이 없어서 외국 상품이 인기를 얻는 경우도 있다. 대표적인 예가 챗GPT다. 챗GPT가 인기를 끌면서 한국의 서점이나 도서관에선 인공지능(AI) 및 챗GPT와 관련된 서적을 쉽게 찾아볼 수 있다. 심지어 챗GPT를 만든 오픈AI의 최고경영자(CEO) 샘 올트먼의 전기까지 한글로 읽을 수 있다.
올해 초 올트먼은 한국에 와서 다양한 사업을 통해 축적한 카카오의 데이터와 오픈AI의 첨단 AI 기술을 결합해 한국 시장을 위한 다양한 AI 서비스 상품을 함께 만든다는 청사진을 밝혔다. 한국은 미국 다음으로 세계에서 챗GPT 유료 사용자가 제일 많은 나라다. 이를 고려하면 오픈AI와 카카오의 협업은 좋은 전략이라고 평가할 수 있다. 그러나 카카오가 기초부터 한국형 AI를 만드는 것이 아닌 점은 못내 아쉽다.챗GPT가 사용자에게 인간과 대화한다는 인상을 주는 비결은 거대언어모델(LLM)에 있다. 대규모 데이터에서 얻은 지식을 바탕으로 자연어 이해와 생성을 극대화하는 기술이다. 다른 LLM과 마찬가지로 챗GPT는 방대한 분량의 언어 데이터를 학습해 사람처럼 글을 쓰거나 분석 및 추론을 한다. 오픈AI가 2020년 출시한 GPT-3 모델의 경우 영어가 학습 데이터의 90% 이상을 차지한다. 그 다음인 프랑스어도 2% 미만이다. 이로부터 5년이 흘렀지만 최신 챗GPT가 사용하는 모델에 들어갈 수 있는 한국어 언어 데이터는 영어에 비해 현저히 적다.
그렇다면 그것이 정말로 문제가 될까? 한국어를 비롯해 다양한 언어로 챗GPT를 사용하는 데 전혀 문제가 없으니 훈련 데이터가 어느 언어로 돼 있는지는 상관 없는 것 아니냐고 주장할 수도 있다. 실제로 한국에서 AI 챗봇의 활용 영역 가운데 번역이 인기가 있는 용도에 든다. 이 점은 챗GPT가 언어 전환에 무리가 없다는 사실을 증명한다.
얼마 전 만난 유명 패션 브랜드 관계자는 영어로 이메일을 쓸 때 챗GPT에 너무 의존한 나머지 이젠 영어로 이메일을 쓰는 법을 점점 잊어버릴 정도라고 말했다. 2021년에 개봉된 공상과학 영화 ‘승리호’에선 서로 다른 나라 사람이 각자 모국어로 말하고, 귀에 부착된 번역장치에 의존해 언어 장벽 없이 원활하게 의사소통하는 장면이 나온다. 그리 먼 미래가 아니지만 그렇게 환상적으로 다가오지만은 않는다.그럼에도 우려되는 점이 있다. LLM이 앞서 말한 방식대로 다양한 언어의 사멸을 막을 수도 있다. 하지만 나는 이러한 기술이 사용자들의 사고방식에 어떤 영향을 미칠까에 대해 염려하게 된다. 챗GPT가 분석하고 추론하는 과정에서 활용하는 데어터는 대부분이 영어로 돼 있다. 즉, 사용자가 자신의 모국어로 물어보고 챗GPT가 그 언어로 답을 한다고 해도 챗GPT가 서양인의 사고로 답변을 풀어나갈 가능성이 높다. 한국인들이 챗GPT를 사용하며 받는 대답에 서양의 세계관이 녹아들어 있을 수 있다는 얘기다. 태어날 때부터 해외에서 창조된 AI 도구로 지식을 쌓은 한국 아이들은 자연스레 서양의 세계관을 내재화하고, 한국 문화로부터 소외될 수 있다.AI는 단순한 기술이 아니라 사고의 틀을 규정하는 도구다. 이러한 점에서 한국형 AI를 만드는 것은 생존의 문제라고 볼 수 있다. 빠른 속도로 다가오는 미래의 기술을 개발하지 못하는 문화는 사멸할 수밖에 없다.
콜린 마샬 미국 출신·칼럼니스트·‘한국 요약 금지’ 저자
© dongA.com All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지
- 좋아요 0개
- 슬퍼요 0개
- 화나요 0개