Eleven v3 — 가장 표현력이 뛰어난 텍스트-음성 변환 모델

1 week ago 4

Eleven v3 (Alpha) 는 감정과 음성 효과까지 정밀하게 제어 가능한, 역대 가장 표현력이 풍부한 텍스트-음성 변환(TTS) 모델임
오디오 태그를 활용해 감정, 말투, 방향성, 효과음 등 다양한 음성 요소를 자유롭게 조합할 수 있음
여러 명의 화자가 대화하는 자연스러운 오디오 생성이 가능하며, 70개 이상의 언어에서 인간에 가까운 음성을 지원함
v2 대비 음성 감정의 폭과 효과 적용 범위가 크게 확장되었으며, UI 사용자는 2025년 6월 말까지 80% 할인 혜택을 받을 수 있음
API 지원은 곧 공개 예정이며, 다양한 음성·상황별 태그는 프롬프트 가이드에서 확인 가능함

Eleven v3 개요

Eleven v3 (alpha) 는 이전 버전과 차별화된, 감정 표현과 몰입감 있는 음성 생성이 가능한 **차세대 Text to Speech(TTS) 모델*임
이 모델은 입력된 텍스트를 사람이 직접 읽는 것과 유사한 방식으로 감정, 억양, 리듬을 표현하면서 음성으로 변환함
사용자는 오디오 태그를 이용해 음성 감정, 말투, 음향 효과, 배경 사운드까지 세밀하게 제어 가능
텍스트 내에 감정, 효과, 연출 태그를 삽입해, 단순 나레이션을 넘어선 입체적인 오디오 제작이 가능하여, 몰입감과 현실감이 크게 향상됨

Dialogue Mode: 다중 화자 대화 지원
Audio Tag 지원: 감정, 방향, 효과 등 다양한 오디오 태그 활용 가능
감정·효과 범위: v2는 일시정지 등 기본 태그, v3는 풍부한 감정과 오디오 효과 적용 가능
언어: v3는 70+ 언어, v2는 29개 언어
- 아프리칸스, 아랍어, 아르메니아어, 아삼어, 아제르바이잔어, 벨라루스어, 벵골어, 보스니아어, 불가리아어, 카탈루냐어, 세부아노어, 크리체와어, 크로아티아어, 체코어, 덴마크어, 네덜란드어, 영어, 에스토니아어, 필리피노어, 핀란드어, 프랑스어, 갈리시아어, 조지아어, 독일어, 그리스어, 구자라트어, 하우사어, 히브리어, 힌디어, 헝가리어, 아이슬란드어, 인도네시아어, 아일랜드어, 이탈리아어, 일본어, 자바어, 칸나다어, 카자흐어, 키르기스어, 한국어, 라트비아어, 링갈라어, 리투아니아어, 룩셈부르크어, 마케도니아어, 말레이어, 말라얄람어, 표준 중국어, 마라티어, 네팔어, 노르웨이어, 파슈토어, 페르시아어, 폴란드어, 포르투갈어, 펀자브어, 루마니아어, 러시아어, 세르비아어, 신디어, 슬로바키아어, 슬로베니아어, 소말리어, 스페인어, 스와힐리어, 스웨덴어, 타밀어, 텔루구어, 태국어, 터키어, 우크라이나어, 우르두어, 베트남어, 웨일스어 등