-
기기나 객체에 절대적으로 중복되지 않는 ID를 부여하는 방법을 탐구하며, 무작위(random) 방식과 결정적(deterministic) 방식을 비교
- 무작위 방식은 충분히 큰 비트 수를 사용하면 충돌 확률을 사실상 0으로 만들 수 있으며, UUID(122비트) 부터 우주 전체 연산 한계(798비트) 까지 다양한 수준 제시
- 결정적 방식에서는 중앙 카운터, 위임형 계층 구조(Dewey) , 이진 트리(Binary) , 토큰(Token) 등 여러 스킴을 제안하고, 각 방식의 ID 길이 성장 특성을 시뮬레이션으로 분석
- 모든 결정적 스킴은 최악의 경우 선형(linear) 성장을 피할 수 없다는 수학적 증명 제시
- 결과적으로 우주적 확장에서도 실용적이고 효율적인 방법은 무작위 ID 생성이며, 결정적 방식은 비효율적임을 확인
고유 ID의 필요성과 문제 설정
-
객체 식별은 제조, 물류, 통신, 보안 등 모든 시스템의 기반이며, 대규모 확장 시 중복 없는 ID 부여가 핵심 과제
- 인류가 은하 규모로 확장할 경우에도 중복 없는 ID 체계가 필요함
- 문제는 “어떻게 하면 절대 중복되지 않는 ID를 만들 수 있는가”로 설정됨
무작위(Random) 방식
- 가장 단순한 방법은 임의의 수를 선택하는 것
- 충돌 확률은 비트 수를 늘려 제어 가능, 사실상 0에 가깝게 조정 가능
-
UUID(122비트) 는 약 $2^{61}$개의 ID를 생성할 때 충돌이 예상됨
-
우주 전체 연산 한계(10¹²⁰회) 를 고려하면 798비트가 필요
- 원자 단위(10⁸⁰개) 기준은 532비트, 1g 나노봇(10⁵⁶개)은 372비트
-
진정한 무작위성 확보가 중요하며, CSPRNG나 양자 난수원 사용 권장
- 흔한 시드나 상수 ID(예: all-zero)는 금지 필요
결정적(Deterministic) 방식
-
중앙 카운터 방식은 단일 서버가 순차적으로 ID를 발급
- 접근성 문제로 위성·기기 간 위임 구조(Dewey) 제안
- Dewey 스킴: A.B.C 형태의 계층적 ID, Elias omega 코딩으로 표현
-
Binary 스킴은 ID 공간을 이진 트리로 분할, 일부 경우 Dewey보다 효율적
-
2-Adic Valuation은 수학적 고유성 보장, Binary의 변형 형태
-
Token 스킴은 체인 구조에서 로그형 성장을 보이지만, 폭이 넓어지면 선형으로 전환
선형 성장의 불가피성 증명
- 모든 ID 부여 경로가 고유해야 함을 전제로, 가능한 경로 수를 계산
- 노드 수가 n일 때 필요한 ID 수는 $2^{n-1}$로 증가
- 따라서 ID 길이는 최소 O(n) , 즉 최악의 경우 선형 성장 불가피
- 어떤 알고리듬도 모든 경우에서 로그형 성장을 유지할 수 없음
확장 모델 시뮬레이션
-
Random Recursive Tree, Preferential Attachment, Fitness Model 등 다양한 성장 모델로 실험
- 소규모(2,048노드)에서는 Binary가 우수, Dewey·Token은 상황별 차이
- Preferential 모델에서는 Dewey가 가장 효율적
- Fitness 모델에서는 Dewey와 Binary가 유사 성능
-
백만 노드 규모 실험에서도 Dewey·Token은 로그형 성장 유지
- ID 길이 ≈ 6.55 × ln(n) 형태로 근사 가능
은하 및 우주 규모 확장 모델
-
행성 간 확산은 일정 속도의 파동(front) 형태로 모델링
- 각 행성은 약 10⁹개의 ID를 생성 후 다음 행성으로 확산
- 은하 반경 약 2,121행성, 전체 확산 시 ID 길이 약 288,048비트
- 은하 간 확산(약 7,816단계)까지 고려 시 약 22억 비트(281MB) 필요
- 결정적 방식은 비효율적이며, 무작위 방식(798비트 이하) 이 압도적으로 효율적
보안 및 추가 고려사항
-
ID 위조 방지를 위해 서명 기반 검증 체계 적용 가능
- 무작위 ID는 공개키를 ID로 사용, 결정적 스킴은 부모가 자식 키에 서명
-
오류 정정 코드와 버전 관리 필요
-
ID 저장 불가 객체(예: 행성)는 여러 ID를 매핑해 관리
-
Theseus의 배 문제처럼 구성 요소 교체 시 ID 지속 여부 논의
- 관련 개념: Decentralized Identifiers(DID) , Ancestry Labeling Schemes
결론
-
결정적 스킴은 이론적으로 흥미롭지만 실용성 낮음
-
무작위 ID 생성이 우주적 규모에서도 현실적이며 효율적
- ID 충돌 확률을 “사실상 0”으로 만드는 것이 가장 안전하고 실용적인 선택임