우주적 규모의 고유 ID

1 month ago 12

  • 기기나 객체에 절대적으로 중복되지 않는 ID를 부여하는 방법을 탐구하며, 무작위(random) 방식과 결정적(deterministic) 방식을 비교
  • 무작위 방식은 충분히 큰 비트 수를 사용하면 충돌 확률을 사실상 0으로 만들 수 있으며, UUID(122비트) 부터 우주 전체 연산 한계(798비트) 까지 다양한 수준 제시
  • 결정적 방식에서는 중앙 카운터, 위임형 계층 구조(Dewey) , 이진 트리(Binary) , 토큰(Token) 등 여러 스킴을 제안하고, 각 방식의 ID 길이 성장 특성을 시뮬레이션으로 분석
  • 모든 결정적 스킴은 최악의 경우 선형(linear) 성장을 피할 수 없다는 수학적 증명 제시
  • 결과적으로 우주적 확장에서도 실용적이고 효율적인 방법은 무작위 ID 생성이며, 결정적 방식은 비효율적임을 확인

고유 ID의 필요성과 문제 설정

  • 객체 식별은 제조, 물류, 통신, 보안 등 모든 시스템의 기반이며, 대규모 확장 시 중복 없는 ID 부여가 핵심 과제
  • 인류가 은하 규모로 확장할 경우에도 중복 없는 ID 체계가 필요함
  • 문제는 “어떻게 하면 절대 중복되지 않는 ID를 만들 수 있는가”로 설정됨

무작위(Random) 방식

  • 가장 단순한 방법은 임의의 수를 선택하는 것
    • 중앙 관리나 동기화 없이 어디서나 생성 가능
  • 충돌 확률은 비트 수를 늘려 제어 가능, 사실상 0에 가깝게 조정 가능
  • UUID(122비트) 는 약 $2^{61}$개의 ID를 생성할 때 충돌이 예상됨
  • 우주 전체 연산 한계(10¹²⁰회) 를 고려하면 798비트가 필요
    • 원자 단위(10⁸⁰개) 기준은 532비트, 1g 나노봇(10⁵⁶개)은 372비트
  • 진정한 무작위성 확보가 중요하며, CSPRNG양자 난수원 사용 권장
    • 흔한 시드나 상수 ID(예: all-zero)는 금지 필요

결정적(Deterministic) 방식

  • 중앙 카운터 방식은 단일 서버가 순차적으로 ID를 발급
    • 접근성 문제로 위성·기기 간 위임 구조(Dewey) 제안
  • Dewey 스킴: A.B.C 형태의 계층적 ID, Elias omega 코딩으로 표현
    • 트리 구조에 따라 로그형 또는 선형 성장
  • Binary 스킴은 ID 공간을 이진 트리로 분할, 일부 경우 Dewey보다 효율적
  • 2-Adic Valuation은 수학적 고유성 보장, Binary의 변형 형태
  • Token 스킴은 체인 구조에서 로그형 성장을 보이지만, 폭이 넓어지면 선형으로 전환

선형 성장의 불가피성 증명

  • 모든 ID 부여 경로가 고유해야 함을 전제로, 가능한 경로 수를 계산
  • 노드 수가 n일 때 필요한 ID 수는 $2^{n-1}$로 증가
  • 따라서 ID 길이는 최소 O(n) , 즉 최악의 경우 선형 성장 불가피
  • 어떤 알고리듬도 모든 경우에서 로그형 성장을 유지할 수 없음

확장 모델 시뮬레이션

  • Random Recursive Tree, Preferential Attachment, Fitness Model 등 다양한 성장 모델로 실험
    • 소규모(2,048노드)에서는 Binary가 우수, Dewey·Token은 상황별 차이
    • Preferential 모델에서는 Dewey가 가장 효율적
    • Fitness 모델에서는 Dewey와 Binary가 유사 성능
  • 백만 노드 규모 실험에서도 Dewey·Token은 로그형 성장 유지
    • ID 길이 ≈ 6.55 × ln(n) 형태로 근사 가능

은하 및 우주 규모 확장 모델

  • 행성 간 확산은 일정 속도의 파동(front) 형태로 모델링
    • 각 행성은 약 10⁹개의 ID를 생성 후 다음 행성으로 확산
  • 은하 반경 약 2,121행성, 전체 확산 시 ID 길이 약 288,048비트
  • 은하 간 확산(약 7,816단계)까지 고려 시 약 22억 비트(281MB) 필요
  • 결정적 방식은 비효율적이며, 무작위 방식(798비트 이하) 이 압도적으로 효율적

보안 및 추가 고려사항

  • ID 위조 방지를 위해 서명 기반 검증 체계 적용 가능
    • 무작위 ID는 공개키를 ID로 사용, 결정적 스킴은 부모가 자식 키에 서명
  • 오류 정정 코드버전 관리 필요
  • ID 저장 불가 객체(예: 행성)는 여러 ID를 매핑해 관리
  • Theseus의 배 문제처럼 구성 요소 교체 시 ID 지속 여부 논의
  • 관련 개념: Decentralized Identifiers(DID) , Ancestry Labeling Schemes

결론

  • 결정적 스킴은 이론적으로 흥미롭지만 실용성 낮음
  • 무작위 ID 생성이 우주적 규모에서도 현실적이며 효율적
  • ID 충돌 확률을 “사실상 0”으로 만드는 것이 가장 안전하고 실용적인 선택

Read Entire Article