엔비디아에서 공개한 Nemotron-Personas-Korea 데이터셋을 활용한 한국인 페르소나 탐색기입니다.
이 데이터셋은 한국인 100만 명 규모의 합성 데이터셋으로, 나이, 직업, 지역, 가족 관계 등이 포함되어 있습니다. 데이터셋 제작 방식이나 통계 정보는 https://news.hada.io/topic?id=28919에 자세히 설명되어 있습니다.
페르소나 탐색기의 주요 기능은 다음과 같습니다.
-
페르소나를 검색하거나 비슷한 페르소나를 찾을 수 있습니다. Qwen s임베딩 모델을 사용하여 유사도를 비교합니다.
-
지도에서 페르소나의 인구 분포를 확인할 수 있습니다. 데이터셋에 있는 위치 정보를 사용합니다.
-
페르소나와 대화할 수 있습니다. 아주 간단한 질문 정도에 답할 수 있습니다.
Qwen 0.6 임베딩 모델로 데이터셋 전체에 대해 1024차원의 임베딩을 추출하여 허깅페이스 데이터셋으로 만들었습니다. *_persona 칼럼에 이름이 반복적으로 들어가는 특징이 있어, 이름에 편향된 임베딩 값을 가질 수 있습니다.

2 weeks ago
18



![[사설] ‘AI 괴물 해커’ 등장, 북한이 가장 관심 있을 것](https://www.chosun.com/resizer/v2/4VXZD5TPHZJIXRV5YQ4T2ETGLQ.jpg?auth=67f6c152837c4859d2d377d7790c043d6ead2ef97e5bc8589c6f83789aa94a72&smart=true&width=720&height=532)

![[천자칼럼] 인간 이긴 로봇 마라토너](https://static.hankyung.com/img/logo/logo-news-sns.png?v=20201130)



English (US) ·