- 2017년 발표된 CheXNet 등 AI 모델은 폐렴 진단에서 인간 방사선 전문의보다 정확한 성능을 나타냈지만, 실제 의료 현장에서는 성과를 재현하지 못하고 있음
- 최근 수백 개의 방사선 인공지능 모델이 FDA 승인을 받았음에도 불구하고, 미국 내 방사선 전문의 근무 자리와 연봉은 오히려 사상 최고치를 기록 중임
-
의료 AI의 한계로, 데이터 부족, 실제 환경과의 차이, 규제와 보험상의 장벽, 그리고 인간 방사선 전문의가 진단 외 다양한 역할을 맡는 구조가 원인임
- 완전한 자동화 대신, 인간과 AI가 병행하는 체계가 의료 업계 표준이 되었으며, AI가 발전해도 방사선 전문의 일손은 줄지 않는 현상임
-
의료 AI 확산의 첫 10년은 AI 기술의 생산성 향상 가능성은 높지만, 실제로는 더 많은 인간 노동 수요를 야기하는 역설을 보여줌
서론: AI의 도입과 기대
- 2017년 등장한 CheXNet 같은 AI 모델은 10만 건이 넘는 흉부 엑스레이 데이터를 학습, 폐렴 판독 정확도에서 인간 전문의보다 우수한 결과를 제시함
- Annalise.ai, Lunit, Aidoc, Qure.ai 등 여러 기업이 수백 질병을 탐지할 수 있는 AI 시스템을 출시, 병원 기록 시스템에도 통합이 가능함
- 700개 이상의 FDA 승인 방사선 AI 모델이 존재하며, 이는 전체 의료 AI 기기의 75%에 해당함
- 방사선과는 디지털 입력과 패턴 인식, 그리고 명확한 성과 측정이 가능하여 AI 대체에 가장 적합한 분야로 평가되어 왔음
- 하지만, 실제로는 방사선 전문의 양성 수요가 사상 최고에 달하고, 임금 또한 2015년 대비 48% 상승하는 등 인간 인력 수요가 증가하는 양상임
AI 방사선 진단 시스템의 한계
실제 환경과 학습 데이터의 차이
- 방사선 AI 모델은 정형화된 데이터와 특정 조건에서 탁월한 성능을 보이지만, 현실 병원 환경에서는 병원별 데이터 차이, 진단 장비 특성, 다양성 부족 등으로 인해 성능이 저하됨
- 대부분의 모델은 특정 질환, 한 이미지 유형에서만 높은 정확도를 내며, 다양한 경우에는 복수의 모델을 번갈아 적용해야 하는 불편함이 발생함
- FDA 승인을 받은 알고리듬도 실제 영상 판독 업무의 일부만 다루고, 주로 뇌졸중, 유방암, 폐암 등 소수 중요 질환에 집중됨
- 소아, 여성, 소수 인종 데이터가 부족한 점, 그리고 질환이 미묘하게 나타나거나 다른 질병과 혼재된 경우에는 예측력이 떨어지는 문제도 있음
벤치마크와 임상 적용의 격차
- 벤치마크 시험에서는 AI가 높은 정량적 지표를 기록하지만, 실제 임상 환경에서는 인간 방사선 전문의와 보조 시스템이 기대만큼 좋은 결과를 내지 못함
- 예를 들어, 유방촬영 분야에서 보조 AI 시스템은 판독 민감도는 높였으나 불필요한 추가 검사와 조직검사(생검) 비율만 증가시키고 암 발견율은 높이지 못함
- 한·두 명의 인간 판독자가 함께 읽는 ‘이중 판독’이 AI 보조보다 암 발견력이 높고, 불필요한 재검 비율도 더 낮은 결과를 보임
법적·제도적 규제가 자동화 속도 제한
- FDA는 방사선 소프트웨어를 ‘보조/분류 도구’와 ‘완전 자동화 도구’로 구분
- 완전 자동화는 희귀하며, IDx-DR과 같이 일부 특수 조건에서만 적용됨
- AI가 판독하기 어려운 이미지는 소프트웨어가 자체적으로 중단 후 의료인에게 전달해야 함
- 규제 요건이 높고, 매번 모델을 재학습·변경할 때도 새 승인이 필요
- 보험사들은 자동화 도구가 실수 시 집단피해 확률이 높다고 보고, 인공지능만으로 진단한 결과에 대해서는 보험 보상을 꺼리는 경향이 있음
- 법률상, 의사가 직접 해석·서명한 판독만 보험 적용이 되는 경우가 표준임
인간 방사선 전문의의 역할 변화
- 실제로 방사선 전문의는 시간의 36%만 영상 해석에 사용하고, 나머지는 환자·동료와의 상담, 검사 감독, 교육, 처방 변경 등 다양한 업무에 할애함
- 영상 판독 시간이 줄어도 불필요한 해고는 일어나지 않았고, 오히려 새로운 업무가 늘어 전반적인 이미지 판독량 자체가 증가하는 현상이 발생함
- 예시로 필름 기반에서 디지털로 전환할 때도 영상 판독 생산성은 뛰었지만 의료진 감축은 없었고, 오히려 전체 영상 검사가 60% 이상 늘어남
- 영상 처리 속도 향상은 검사 대기시간 감소, 응급상황 대응력 향상 등 의료 시스템 내 활용도 다양화로 이어짐
향후 전망: AI 확산의 첫 10년의 교훈
- 지난 10년간 일상 진료 도입은 AI 모델의 기술 수준보다 훨씬 느리게 진전 중
- 규제, 보험, 환자 상담, 의사 주체성 등 비기술적 요인이 완전 대체 장벽으로 작용함
- AI가 인력 대체보다 인간과의 협업을 통한 생산성 강화에 기여하는 형태가 기본 모델이 됨
- 대형 플랫폼(예: Facebook)에서는 AI로 자동화 가능성이 높지만, 지식 일자리가 다양한 업무로 구성될수록 소프트웨어 도입이 인간 노동량을 줄이기보다 늘리는 경향이 있음
- 방사선 분야에서의 경험은 AI가 인간 업무를 즉시 대체하기보다는, 오히려 사회·제도·행동적 변화와 함께 인간 인력 수요를 유지 또는 확대시키는 역설적 결과를 보여줌