GitHub Copilot 상호작용 데이터 사용 정책 업데이트
3 hours ago
1
- 2026년 4월 24일부터 Copilot Free·Pro·Pro+ 사용자 데이터가 AI 모델 학습 및 개선에 활용되며, 사용자는 옵트아웃 설정으로 이를 거부할 수 있음
-
Business 및 Enterprise 사용자는 이번 변경의 영향을 받지 않으며, 이전에 거부 설정을 한 경우 기존 선택이 유지됨
- 학습 데이터에는 입력 코드, 출력 결과, 커서 주변 컨텍스트, 피드백 평가 등 실제 개발 상호작용 정보가 포함됨
-
기업 저장소, 비공개 콘텐츠, 옵트아웃 사용자 데이터는 학습에 사용되지 않으며, 데이터는 Microsoft 등 GitHub 계열사와만 공유됨
- GitHub은 실제 개발자 상호작용 데이터가 정확도·보안성·버그 탐지 능력 향상에 핵심적이라며, 개발자 자발적 참여를 강조함
GitHub Copilot 상호작용 데이터 사용 정책 업데이트
- 2026년 4월 24일부터 Copilot Free, Pro, Pro+ 사용자의 상호작용 데이터(입력, 출력, 코드 스니펫, 관련 컨텍스트)가 AI 모델 학습 및 개선에 사용됨
- 단, 사용자가 옵트아웃(opt-out) 하면 데이터는 학습에 사용되지 않음
-
Copilot Business 및 Enterprise 사용자는 이번 변경의 영향을 받지 않음
- 이전에 데이터 수집 거부 설정을 한 사용자는 기존 선택이 유지되며, 명시적으로 동의하지 않는 한 데이터는 학습에 포함되지 않음
- GitHub은 이번 변경이 산업 표준 관행에 부합하며, 모델의 정확도·보안성·버그 탐지 능력 향상에 기여한다고 밝힘
- 사용자는 설정 페이지의 Privacy 항목에서 언제든 참여 여부를 변경할 수 있음
실제 데이터 기반 학습의 필요성
- 초기 Copilot 모델은 공개 데이터와 수작업 코드 샘플을 기반으로 구축됨
- 이후 Microsoft 직원의 상호작용 데이터를 포함해 학습을 진행했으며, 여러 프로그래밍 언어에서 수용률(acceptance rate) 향상 등 유의미한 개선이 확인됨
- GitHub은 이러한 결과를 바탕으로 다양한 실제 사용 사례를 반영하기 위해 실제 개발자 상호작용 데이터를 학습에 포함하기로 함
수집 및 활용되는 데이터 항목
- 모델 학습에 사용될 수 있는 데이터는 다음과 같음
- 사용자가 수락하거나 수정한 출력 결과
- Copilot에 입력된 코드 스니펫 및 요청 내용
-
커서 주변 코드 컨텍스트
-
파일명, 저장소 구조, 탐색 패턴
-
Copilot 기능과의 상호작용(채팅, 인라인 제안 등)
- 제안에 대한 피드백(좋아요/싫어요 평가)
학습에 포함되지 않는 데이터
- 다음 데이터는 모델 학습에 사용되지 않음
-
Copilot Business, Enterprise, 기업 소유 저장소의 상호작용 데이터
-
옵트아웃한 사용자의 데이터
-
이슈, 토론, 비활성(private at rest) 저장소의 콘텐츠
- 단, Copilot 사용 중에는 비공개 저장소의 코드가 서비스 실행을 위해 처리될 수 있으며, 옵트아웃하지 않은 경우 학습에 포함될 수 있음
데이터 공유 및 보안 범위
- 수집된 데이터는 GitHub 계열사(예: Microsoft) 와 공유될 수 있음
- 그러나 제3자 AI 모델 제공자나 외부 서비스 업체와는 공유되지 않음
- GitHub은 AI 보조 개발의 발전이 실제 개발자 상호작용 데이터에 달려 있음을 강조하며,
Microsoft 및 GitHub 직원 데이터를 이미 모델 학습에 활용 중임
사용자 선택과 영향
- 사용자가 데이터 제공에 동의하면, 모델은 개발 워크플로우 이해도 향상, 정확하고 안전한 코드 제안, 버그 사전 탐지 능력 강화 등의 개선을 얻게 됨
- 참여하지 않더라도 Copilot의 기존 AI 기능은 그대로 이용 가능
- GitHub은 개발자 커뮤니티 전체의 품질 향상을 위해 자발적 참여를 환영하며,
관련 문의는 FAQ 및 커뮤니티 토론 페이지에서 확인 가능
-
Homepage
-
개발자
- GitHub Copilot 상호작용 데이터 사용 정책 업데이트