2025 AI Index Report

2 days ago 3

  • AI의 사회적 영향력은 지금이 가장 뚜렷하며, 그 파급력은 가히 역사적임
  • Stanford HAI는 AI가 21세기 최고의 변혁 기술이 될 것으로 보고 있음
  • 그러나 AI 발전의 혜택이 모두에게 골고루 돌아가려면, 방향성 있는 개발이 필요하다고 강조함
  • AI Index는 AI의 기술적 진보, 경제적 영향, 사회적 영향을 객관적으로 분석하여 정책 입안자와 기업 리더에게 중요한 통찰을 제공함

1. 고난도 벤치마크에서의 AI 성능이 지속적으로 향상됨

  • 2023년, 연구자들은 최신 AI 시스템의 한계를 시험하기 위해 새로운 벤치마크 도입:
    • MMMU, GPQA, SWE-bench
  • 불과 1년 만에 성능이 대폭 향상됨:
    • MMMU: +18.8%p
    • GPQA: +48.9%p
    • SWE-bench: +67.3%p
  • 벤치마크 외에도, AI는 고품질 비디오 생성 기술에서 눈에 띄는 진전을 보임
  • 일부 환경에서는 언어 모델 기반 에이전트가 제한된 시간 내 인간보다 뛰어난 프로그래밍 성과를 내기도 함

2. AI는 일상 생활 속으로 빠르게 확산 중

  • 의료부터 교통까지, AI는 실험실을 넘어 일상 생활에 본격적으로 통합되고 있음
  • 2023년, 미 FDA는 AI 기반 의료기기 223개를 승인 (2015년에는 단 6개에 불과)
  • 자율주행차는 더 이상 실험이 아닌 상용화 단계에 돌입
    • Waymo: 매주 15만 건 이상의 자율주행 이동 서비스 제공
    • Baidu: Apollo Go 로보택시를 통해 중국 여러 도시에서 상용 서비스 운영

3. 기업은 AI 도입에 전폭적인 투자와 활용을 진행 중

  • 2024년, 미국의 민간 AI 투자액은 1,091억 달러로 전 세계 최고 수준
    • 중국(93억 달러)의 약 12배, 영국(45억 달러)의 약 24배
  • 특히 생성형 AI 분야에만 339억 달러가 투자됨 → 2023년 대비 18.7% 증가
  • AI 사용 기업 비율도 빠르게 증가:
    • 2023년 55% → 2024년에는 78%가 AI를 도입했다고 보고
  • 연구 결과에 따르면, AI는 전반적으로 생산성 향상과 함께
    • 직무 간 숙련도 격차 해소에도 긍정적 기여

4. 미국은 여전히 주요 AI 모델 생산 선도국이나, 중국이 빠르게 성능 격차를 좁히고 있음

  • 2024년 기준, 미국은 40개의 주요 AI 모델을 발표하여 **중국(15개), 유럽(3개)**을 크게 앞섬
  • 수량에서는 미국이 앞서지만, 중국 모델의 품질 격차는 빠르게 축소
    • 대표 벤치마크(MMLU, HumanEval)에서 2023년 두 자릿수 차이 → 2024년 거의 동등 수준으로 변화
  • 중국은 여전히 AI 논문 및 특허 수에서 세계 1위
  • AI 모델 개발은 점점 중동, 라틴 아메리카, 동남아 등으로 다변화되고 있음

5. 책임 있는 AI(RAI) 생태계는 진화 중이나 불균형함

  • AI 관련 사고와 문제는 급증하고 있으나, 대형 산업 모델 개발자들은 여전히 RAI 표준 평가 도입이 드묾
  • 새로운 안전성 평가 벤치마크 등장:
    • HELM Safety, AIR-Bench, FACTS정확성과 안전성 평가에 유망한 도구
  • 기업들은 RAI 리스크 인식은 높지만, 실질적 조치에는 미흡
  • 반면, 정부는 AI 거버넌스에 대한 대응 속도 가속화
    • OECD, EU, UN, 아프리카 연합 등에서 투명성과 신뢰성을 중시하는 정책 프레임워크 발표

6. 글로벌 AI에 대한 낙관론은 상승세지만 지역 간 격차는 큼

  • AI가 유익하다고 보는 비율:
    • 중국(83%), 인도네시아(80%), 태국(77%) 등에서는 긍정 평가 다수
    • 캐나다(40%), 미국(39%), 네덜란드(36%) 등은 낮은 수치 기록
  • 그러나 낙관론은 증가세:
    • 2022년 대비 낙관적 인식 상승: 독일(+10%), 프랑스(+10%), 캐나다(+8%), 영국(+8%), 미국(+4%)

7. AI는 더 효율적이고 저렴하며 접근 가능한 방향으로 발전 중

  • 소형 모델의 성능 향상에 힘입어, GPT-3.5 수준 모델의 추론 비용이 2022년 11월 → 2024년 10월 사이에 280배 감소
  • 하드웨어 측면에서:
    • 연간 비용 30% 감소
    • 에너지 효율 40% 향상
  • 오픈 웨이트 모델도 급격히 성능 향상 중
    • 일부 벤치마크에서 폐쇄형 모델과의 성능 차이를 8% → 1.7%로 축소
  • 이 모든 요소가 고급 AI 기술의 진입 장벽을 빠르게 낮추고 있음

8. 각국 정부는 AI 규제와 투자에 본격적으로 나서고 있음

  • 2024년 미국 연방 기관은 AI 관련 규제를 59건 발표
    • 2023년보다 2배 이상 증가, 관련 기관 수도 2배로 확대
  • 75개국에서 AI 관련 입법 언급이 21.3% 증가
    • 2016년 대비 9배 증가
  • 주요 정부 투자 사례:
    • 캐나다: $24억, 중국: $475억 반도체 펀드
    • 프랑스: €1,090억, 인도: $12.5억
    • 사우디아라비아: Project Transcendence로 $1,000억 투자

9. AI 및 컴퓨터 과학 교육 확산 중, 그러나 접근성과 준비 부족 문제 존재

  • 세계 국가의 2/3가 K–12 컴퓨터 과학 교육을 시행 또는 계획 중
    • 2019년보다 2배 증가
    • 아프리카와 라틴 아메리카에서 가장 빠른 진전
  • 미국 내 컴퓨터 관련 학사 학위 취득자 수는 10년간 22% 증가
  • 하지만 **기초 인프라 부족(전기 등)**으로 인해 아프리카 일부 지역은 여전히 접근이 어려움
  • 미국의 K–12 컴퓨터 과학 교사 중 81%는 AI가 필수 교육 요소라고 생각하지만,
    • 절반 이하만이 실제로 AI를 가르칠 준비가 되어 있다고 응답

10. 산업계는 AI 개발을 선도 중이지만 경쟁은 치열해지고 있음

  • 2024년 주요 AI 모델의 약 90%가 산업계에서 개발됨 (2023년에는 60%)
  • 반면, 가장 많이 인용된 AI 연구는 여전히 학계에서 나옴
  • 모델 규모는 계속 확장 중:
    • 학습 연산량은 5개월마다 2배
    • 데이터셋은 8개월마다 2배
    • 전력 사용량은 매년 2배 증가
  • 하지만 성능 격차는 줄어드는 추세:
    • 상위 1위와 10위 모델 간 점수 차이: 11.9% → 5.4%
    • 1위와 2위 모델 간 차이: 단 0.7%
  • 이는 경쟁이 치열하고 복잡성이 증가한 AI 개발 환경을 의미함

11. AI는 과학 분야에서 최고 권위를 인정받고 있음

  • AI는 최근 노벨상 수상 연구의 핵심 기술로 인정받음
    • 딥러닝 기술(물리학 부문), **단백질 구조 예측 응용(화학 부문)**으로 각각 수상
  • 또한, 강화학습 분야의 획기적인 공로로 튜링상도 수여됨
  • 이는 AI의 과학적 영향력이 주요 학문 분야에서 정식으로 인정받기 시작했음을 시사

12. 복잡한 추론은 여전히 AI의 큰 도전 과제로 남아 있음

  • AI는 국제 수학 올림피아드 수준 문제 해결에는 뛰어난 성과를 보임
  • 그러나 PlanBench와 같은 복잡한 추론 벤치마크에서는 여전히 어려움을 겪음
  • 명확한 정답이 존재함에도 불구하고, 일관되게 논리 문제를 해결하지 못하는 경우가 많음
  • 이로 인해, 정확성이 중요한 고위험 분야에서 AI의 실효성에는 한계가 있음

Read Entire Article