드림토닉스 Dreamtonics |
|
<colbgcolor=#005afa,#333333><colcolor=#ffffff,#dddddd> 기업명 |
드림토닉스 주식회사 Dreamtonics株式会社( 일본어) Dreamtonics Co., Ltd.( 영어) |
국가 |
[[일본| ]][[틀:국기| ]][[틀:국기| ]] |
형태 | 주식회사 |
사업내용 |
전자음악과 음성기술에 특화된 소프트웨어 구축 기술 라이센스 제공 인공음성 작성 서비스 제공 등 |
설립 | 2019년 2월 |
대표자 | Kanru Hua (華侃如) |
본사 |
일본
도쿄도
다이토구 아사쿠사바시 5초메 8-11 大富ビル 501호실 |
웹사이트 |
[clearfix]
1. 개요
일본에 위치한 음성, 가성합성 기술을 연구하여 소프트웨어를 구축·제공하고 있는 회사이다.고음질, 경량, 다기능, 빠른 업데이트 혁신성이 특징이다.
23년에 넘어와서 기능 성능 외적으로 문제를 일으키고 있다.
23년 1월 23일 어느 유튜버에게 바이럴을 맡기고 완성된 동영상을 영어 공계에서 홍보했는데 동영상 내용이 무단 학습으로 말이 많은 AI 그림을 예를 들면서 Synthesizer V를 그와 비슷하게 취급하면서 설명한지라 마치 Synthesizer V가 AI 그림처럼 남의 목소리를 무단 학습해서 만든 프로그램으로 오해할 여지가 있어 보컬신디사이저 팬들이 분노했다. 이로인해 자기들이 바이럴을 맡겨놓고 내용도 확인 안 하냐며 욕먹었다.
23년 2월 3일 금요일 신규음원 ninezero의 데모를 발표 했는데 하필이면 이 음원의 음성제공자가 안티백서에 크립토 브로[1]여서 논란이 되었다.
정보전달이 늦는 한국 특성상 이 회사를 중국걸로 착각하는 사람이 많다...
물론 자사 제작 신디사이저V 라이브러리의 만다린화자수가 압도적으로 많다지만 제작자의 제1언어인 이상 연구나 개발이 쉬워 그런것 뿐이다.
하지만 어디까지나 이사회장을 일본인으로 둘 만큼의 일본 회사이다
2. 프로그램
2.1. Synthesizer V
Synthesizer V는 Dreamtonics에서 개발한 음성합성엔진 소프트웨어이며 VOCALOID처럼 컴퓨터가 노래를 부르게 하는 프로그램이다.- Synthesizer V 소개영상
2.1.1. Synthesizer V Engine SDK
일반 사용자가 아닌, 법인을 대상으로한 프로그램이며 Synthesizer V의 음성데이베이스제작하거나 다른 제품에 적용하기 위한 프로그램으로 예상된다.2.2. Syllaflow
Syllaflow는 드림토닉스에서 개발한 고품질 음성합성 엔진이다.
2021년 9월 17일 드림토닉스 일, 영 공계에서 고품질 tts를 개발하고 있다고 소식을 전해왔으며, 2022년 2월 17일 드림토닉스가 트위터를 통해 공식적으로 Syllaflow에 대해서 언급을 하였다.
기존 일본계 tts의 퀄리티를 가볍게 뛰어넘는 고음질 고성능이라고 알수 있다.
aiTalk계열이나 CeVIO talk, VOICEVOX, coefontStudio등이 안고 있는 떨림, 노이즈, 먹먹함, 낮은 음질 등의 문제점이 거의 느껴지지 않는 정도.
dtm스테이션 칼럼에서 중국어, 영어음원도 제작 및 발매가 가능함은 물론 SynthesizerV AI에서 지원하는 기능인 다국어 합성기능도 추후 탑재 예정이라고 한다.
2.2.1. VOICEPEAK
고성능 tts엔진인 Syllaflow가 탑재된 간편하게 읽는 것이 가능한 입력 문자 읽는 소프트웨어이며, 감정 파라미터가 타엔진 TTS와는 다르게 사람에 가까운 억양 자연스러움을 느끼게 해준다.데이터 압축률이 뛰어나 매우 가벼운 용량또한 매력이다.
아직은 최적화가 덜 되어 있어 CPU를 잡아먹고 있는 등의 업데이트의 여지가 많은 상태이다. 신디사이저V프로가 공동 개발을 하고 있는 AHS사의 신제품의 프레스발표나 발매일에 맞추어 업데이트를 빈번하게 하기 때문에 앞선 문제점은 서서히 해소될 전망이다.
- VOICEPEAK 상용가능 6나레이터 세트 안내영상
2.3. Vocoflex
Dreamtonics에서 2024년 4월 16일에 공개한 리얼타임 음성 모핑 소프트웨어이다실험용으로 소프트웨어를 공개했지만 공식 출시 계획은 아직 없다고한다
모핑할 음성파일 1개 혹은 여러 개[2]를 넣으면 그 음성파일을 기반으로 실시간으로 음성을 모핑해준다
다른 음성 모핑 소프트웨어랑 다른점은 음성 합성 지연시간이 매우 낮고[3] 비교적 가볍게 돌아간다는 점이다 [4]
또한 HEX 코드를 통해 음성의 스타일을 정하고 표현할 수 있다
악용할 가능성이 있기에, Dreamtonics의 대표 Kanru Hua는 비윤리적인 방법으로 사용되지 않도록 주의를 기울이고 있다고 Vocoflex 공개당시에 영어로 직접 안내를 했으며 Synthesizer V와 다르게 생성된 음성파일에는 오디오 워터마크가 포함된다 [5]
VST를 지원하기에, VST 호환 DAW에서 사용할 수 있다 [6]
EULA약관에서는 "사용자는 특정인의 음성을 무단으로 복제하여 공개해서는 안 됩니다." 라고 명시되어있다
3. 관련 링크
4. 둘러보기
||<tablealign=center><tablebordercolor=#fff,#1f2023><color=#fff><tablewidth=100%> ||
[1]
crypto bro. 암호화폐를 적극적으로 이용하는 사람을 비하하는 말로 서양에선 암호화폐에 대한 인식이 좋지않다.
[2]
여러 개를 넣을경우 해당 목소리들의 중간점에서 음성 합성이 가능하다
[3]
Lowest Latency Mode에서는 왕복 45ms, Highest Quality Mode에서는 왕복 160ms이다
[4]
GPU사용을 안하며 CPU만 사용한다 i5-7300U 또는 Ryzen 3 3300U 이상의 CPU와 4GB RAM이 권장 사양이다
[5]
실제로는 들을 수 없는 사운드 워터마크(Vocoflex의 라이센스 ID)가 출력된 음성파일에 포함된다
[6]
시연 영상에서는
Synthesizer V와 Vocoflex VST를 통한 조합을 보여줬다