-
LLM들에 대한 논리적 함정 질문. 많은 모델이 자동차를 세차장에 가져가야 한다는 전제를 놓치고 걸어가라고 함
- ChatGPT, Claude, Deepseek, Qwen 등 유명한 여러 모델이 서로 다른 답변과 논리적 오류를 보임
- 이 사례는 LLM의 상식적 추론 한계와 비일관성을 드러냄
세차장 50미터 문제와 LLM 반응
- 질문은 “세차장이 50미터 떨어져 있다면 걸어갈까 운전할까?”로, 자동차를 세차장에 가져가야 한다는 기본 전제를 시험
-
Perplexity : "50m 정도는 짧으니까 걸어갈 것. 차를 짧은 거리 움직이는 것은 비효율적임"
-
ChatGPT 5.2 : "50m 거리면 걷는게 실용적임. 30~40초면 가능. 날씨가 안좋거나 무거운게 있으면 운전할 것, 그외엔 걷는게 간단하고 이성적"
-
Claude : "50m 면 걸을 것. 운전은 터무니 없음. 차에 기어를 넣기도 전에 브레이크를 밟아야 할 것. 30-45초면 되고 주차할 필요도 없음"
-
DeepSeek : "걸어가면 다시 돌아와서 차를 몰아야 함. 편리하려면 운전하고, 환경을 위해서는 걷고(다시 운전할 것)"
-
Qwen3-Max : "무조건 걸어야함. 짧게 운전하면 환경에도 안좋음. 걷는건 운동도 됨"
사용자들의 반응과 논평
- “걸어가기 위해서는 자동차를 들고 가야함”
- “Deepseek은 그래도 차를 세차장에 가져가야 한다는 점을 인식했네”
- Gemini와 ChatGPT는 문제의 함정을 인식하고 올바른 답변을 내놓기도 함
- “50m 호스가 필요하냐”는 질문에 GPT-OSS가 “25m면 충분하다”고 답함
- “이건 ‘개발자 장보기 문제’와 같다”