-
LLM은 단순히 수학적 함수일 뿐, 인간적 속성이나 의도를 부여하는 것은 바람직하지 않음
- 단어 공간에서 통계적 경로 생성과 시퀀스 확률 모델링을 통해 언어를 생성하는 원리 설명
- 바람직하지 않은 언어 시퀀스 방지와 정렬(Alignment) , 안전성 문제 제기, 그러나 본질적으로 수학적 한계 존재
-
LLM의 놀라운 실용성과 함께, 윤리 등 인간적 개념을 함수에 투영하면 논의를 흐린다는 주장
- 인간 의식과 LLM은 본질적으로 다르며, 기술적 이해와 사회적 변화 대응이 중요함
LLM을 인간처럼 보지 않는 시각의 필요성
LLM, 의인화(인간처럼 생각) 논의에 대한 문제의식
- AI와 LLM(대형 언어 모델) 관련 논의에서 alignment(정렬)나 AI 안전성이 등장할 때, 많은 전문가들이 LLM에 인간적 속성(의식, 의도 등)을 부여하는 경향에 혼란을 느낌
- LLM은 본질적으로 MatMul(행렬 곱셈)과 비선형 함수의 조합으로 볼 수 있음
단어 공간과 경로의 이해
-
토크나이즈 및 임베딩 단계는 개별 단어(토큰)를 벡터로 매핑하고, 한 편의 글은 높은 차원의 공간에서 단어 간 경로(라인)로 볼 수 있음
- 게임 Snake에서처럼, LLM은 이전까지의 경로(문맥)를 바탕으로 다음 단어가 될 확률을 계산하고, 해당 확률에 따라 다음 토큰(단어)을 선택함
- LLM의 시퀀스 생성 원리를 동적계의 strange attractor(기묘 인력자) 와 유사하게 비유함
학습 방식
- LLM은 인간이 쓴 대량의 텍스트 + 전문 분야 코퍼스 + 자동 생성 및 검증 가능한 데이터로부터 학습하여, 인간 언어의 구조를 본뜬 매핑을 얻음
피해야 하는 경로(언어 시퀀스)와 정렬(Alignment), 안전 문제
- 특정 언어 시퀀스는 사회적으로 또는 기술적으로 바람직하지 않아 예시와 반례로 학습 분포를 조정하고자 함
- "정렬(Alignment)"과 "안전성"이란, 바람직하지 않은 시퀀스가 생성될 확률을 정량화·제한하는 일임
- 하지만 실제로 '바람직하지 않은' 시퀀스 기준을 수학적으로 명확히 정의할 수 없음, 오직 예시로만 가능하므로 한계가 뚜렷함
- 특정 LLM에서 주어진 시퀀스가 나올 확률을 계산할 수는 있지만, 그 전체 확률을 더하거나 적분해서 '이 모델이 N번마다 바람직하지 않은 시퀀스를 만듦'이라고 단정할 수 없음
LLM의 놀라운 실용성
- LLM은 기존 자연어처리(NLP) 의 많은 문제를 알고리듬으로 풀 수 있게 해줌
- 예시: 자연스러운 영어로 문서 요약, 키 데이터 추출, 동화와 그림 생성 등, 5~6년 전에는 불가능하던 영역 가능
-
향후 LLM이 해결할 난제는 아직 많으며, 급격한 발전 곡선을 그리고 있음
의인화가 불필요하다고 느끼는 지점
- LLM에 의식, 윤리, 가치, 도덕 등의 속성을 부여하는 논의는 근거가 희박함
- LLM은 대규모 반복 방정식을 통해 단어를 생성하는 함수로 볼 수 있음
- 인간적 개념을 함수(수학적 객체)에 적용하는 것은 논의를 혼란스럽게 하며, 기술을 어렵고 신비롭게 만듦
-
해로운 시퀀스 자체를 명확히 정의·나열하지 못하기 때문에, 행위(behavior)·윤리적 제약·목표 달성 등 인간 중심 용어 대신, '함수로서 시퀀스를 어떻게 생성하는가'에 집중해야 함
AI 업계 리더의 의인화 경향에 대한 견해
-
AI 업계 리더 및 연구자들이 AGI(일반 인공지능) 실현, 신적 존재 창조 등 믿음 기반으로 진로를 선택했기 때문에 의인화 경향이 있을 수 있음
인간 의식과 LLM의 질적 차이
- 인간은 수억 년 진화, 수많은 신경망, 복잡한 입력, 호르몬, 에너지 조절, 극한 생존 경쟁 압력 등의 본질적으로 다층적이고 복합적인 존재
- 인간이 특정 시퀀스를 생성할 확률을 계산하는 것은 불가능
- LLM에 윤리, 본능, 두려움 같은 인간 개념을 적용하는 것은 수치 해석 시뮬레이션 프로그램의 감정 논의만큼이나 어색함
진짜 중요한 쟁점들
-
현대 LLM이 제공하는 함수형 클래스는 매우 쓸모 있으며, AGI에 전혀 접근하지 못하더라도 사회에 큰 변화를 야기함
- LLM의 영향은 전기화처럼 근본적인 구조 변화를 일으킬 것임
- 앞으로 기술 발전, 사회 변화, 윤리 논의 과정에서 감정적 또는 인간 중심 용어가 아닌, 엄밀한 함수적 사고가 필요함