Evelin Poolamets

Synthesizer V — музыкальное программное обеспечение, синтезатор речи, имеющий 3 поколения: устаревшие Synthesizer V и Synthesizer V Studio, и разрабатываемый Synthesizer V Studio 2.[1]

История

Synthesizer V

Каньжу Хуа заявил в Twitter, что первая строка кода, the proto-proto libllsm (написанная в марте 2015 года), в конечном итоге стала частью Synthesizer V.[2] Разработка Synthesizer V началась в 2017 году. Каньжу Хуа выпустил демо[3] с тремя вокалами, известными в то время как ENG-F1 (позже выпущенную как Eleanor Forte), JA-F1 и MAN-M1. Synthesizer V впервые официально дебютировал 1 декабря 2017 года.[4] В августе 2018 года Каньжу Хуа выпустил «Техническую предварительную» версию Synthesizer V.

Synthesizer V Studio

31 мая 2019 года Каньжу Хуа объявил в Твиттере, что он принимает заявки на инженеров-программистов C++ для работы над следующей версией Synthesizer V, которая стала известна как Synthesizer V Release 2. Позже в 2020 году она станет известна как Synthesizer V Studio.

Synthesizer V Studio Pro и Synthesizer V Studio Basic были официально анонсированы 26 июня компанией AH-Software Co. Ltd. в пресс-релизе, как и голосовые базы данных Kotonoha Akane & Aoi и Saki.

Synthesizer V AI

Обновление для Synthesizer V Studio под названием Synthesizer V AI было официально анонсировано 30 октября 2020 года компанией Dreamtonics в пресс-релизе, как и голосовые базы данных Saki AI и Koharu Rikka, которые должны распространяться AH-Software Co. Ltd.

Демонстрации для Synthesizer V AI были загружены на каналы YouTube Dreamtonics и AH-Software Co. Ltd. соответственно, демонстрируя Saki AI. Также было загружено сравнительное видео между стандартным вокалом Synthesizer V Studio Saki и версией AI[5].

23 декабря была выпущена версия 1.5.0, которая принесла новые комплексные обновления для войсбанков на основе ИИ. Ее основным обновлением стал Межъязыковой синтез который позволил голосовым базам данных ИИ петь на английском, японском и китайском языках независимо от того, изучал ли вокалист эти языки или нет[6]. Ранее войсбанки были ограничены только языковым знанием поставщиков голосов, на которых они были основаны. К этому времени все выпущенные войсбанки ИИ получат обновление для поддержки межъязыкового синтеза, и новая функция будет доступна только для редактора Pro.

Synthesizer V Studio 2

О запуске Synthesizer V Studio 2 было объявлено 24 декабря 2024 года в сообщении на официальном аккаунте Dreamtonics Co., Ltd. в Twitter, а также одновременно было объявлено о его презентации на предстоящей выставке NAMM 2025 в конференц-центре Анахайма, которая прошла с 23 по 25 января[7][8]. 13 февраля в магазине Dreamtonics International Store и магазине AHS компании AH-Software Co. Ltd. открылись предварительные заказы на Synthesizer V Studio 2 Pro, а также на различные войсбанки Synthesizer V 2 AI, с подтвержденной датой выпуска 21 марта согласно листингу Amazon Japan (который был восстановлен на следующий день)[9][10]. В магазине Dreamtonics Store SVS2 Pro предлагался (только в формате цифровой загрузки) как отдельный редактор и как пакет с любым войсбанком SV2 AI по выбору пользователя; также была предложена очень выгодная версия обновления в течение ограниченного времени зарегистрированным владельцам уходящего редактора Synthesizer V Studio Pro, который должен быть снят с продажи, как только выйдет новая версия. В магазине AHS Store предлагались как физические, так и цифровые версии редактора SVS2 Pro, а также только физический стартовый пакет, который, как и в случае с уходящим стартовым пакетом SVS Pro (который также должен был быть прекращен 21 марта), включал купон, который можно было использовать (после выпуска) для любого цифрового войсбанка из утвержденного списка, предоставленного AH-Software (включавшего не только вокал Synthesizer V 2 AI, но также вокал Synthesizer V Standard и Synthesizer V AI, изначально разработанный для старого редактора SVS Pro).

25 января 2025 года Dreamtonics опубликовала видео, демонстрирующее рабочую версию программного обеспечения[11]. Ниже приведен неполный список функций, показанных в этом видео:

  • Режимы пения и рэпа на панели заметок (режим ручного изменения высоты тона, который присутствовал в Synthesizer V Studio 1, отсутствует)
  • Ручное рисование изгибов высоты тона, которые влияют на генерацию высоты тона и повторные попытки ИИ (AI Retakes)[12].
  • Обновленные модели в Synthesizer V Studio 2 Pro точнее воспроизводят динамику человеческого голоса, что приводит к большему ощущению присутствия с более тонкими деталями. Это улучшение достигается без ущерба для произношения и точности высоты тона. Кроме того, сохраненная динамика позволяет AI Retakes генерировать более разнообразные варианты, предоставляя пользователям больше возможностей для достижения желаемого шаблона.
  • Благодаря улучшенному алгоритму и улучшенной поддержке многопоточности Synthesizer V Studio 2 Pro выполняет рендеринг на 300% быстрее, чем его предшественник. Этот значительный прирост скорости достигается без необходимости использования выделенного графического процессора или аппаратного ускорения, что позволяет использовать его без проблем в автономном режиме.

Технические характеристики

По утверждению разработчиков, Synthesizer V Studio сочетает в себе Standard-ные и новые модели синтеза вокала с использованием искусственного интеллекта (AI). Программа не требует от пользователя каких-либо сложных манипуляций и способна во время работы совершать переход от обычных сэмплов к настоящей записи человеческого голоса, когда это необходимо. Базовая версия синтезатора распространяется бесплатно, но образцы голоса в ней являются облегчёнными (Lite) и уступают в технических возможностях улучшенной версии[1][13].

ИИ (AI) и стандартные (Standard) войсбанки

Стандартные войсбанки являются войсбанками, записанные с отдельными сэмплами, как в таких программах как VOCALOID (1, 2, 3, 4, 5) и UTAU. Они были в первом синтезаторе Synthesizer V и ранних войсбанках Synthesizer V Studio. VOLOR и Eclipsed Sounds, LLC отметили, что стандартные войсбанки должны быть записаны в студии Dreamtonics в Токио, Япония[14]. Для сравнения, войсбанки AI используют запись на основе песен и дадут возможность сделать это удаленно, при этом машинное обучение будет выполняться только Dreamtonics.[15] Также было отмечено, что банки AI могут звучать совсем иначе, чем Standard аналоги, но также могут привнести больше экспрессии. В целом стандартные банки звучат более роботизировано[16]. К настоящему времени они больше не производятся.

Сэмплы

Сэмплы с голосами войсбанков находятся в файлах с расширением «svpk»[17]. Голосовые провайдеры Элеоноры Форте, Саки и многих других неизвестны, потому что их голосовые образцы являются исключительной собственностью компании «Dreamtonics», которая подписала с голосовыми провайдерами договор о неразглашении конфиденциальной информации[18].

Функции

Межъязыковой синтез

Synthesizer V Studio в настоящее время поддерживает межъязыковой синтез для японского, английского, севернокитайского (мандарин), кантонского и испанского. Это поддерживается только для голосовых банков с ИИ и в про-версиях Synthesizer V Studio Pro. Однако облегченные ИИ версии банков (Lite) не поддерживают функцию в Synthesizer V Studio Pro.

В 2024 году в Университете Торонто Метрополитен было объявлено о разработке корейского и французского для Synthesizer V Studio[19]. В итоге корейский станет доступным в Synthesizer V Studio 2[20].

Вокал-моды

Вокал-моды (англ. Vocal Mode) - это разные тона вокала, такие как "Soft" и "Whisper". Они не поддерживаются в облегченных Lite-версиях войсбанков. У разных банков может быть разное количество вокал-модов: у NOA доступно 13 вокал-модов: "Attack", "Solid", "Clear", "Deep", "Flow", "Glow", "Husky", "Nasal", "Power", "Smooth", "Twangy", "Vivid", "Waltz" и "Whisper"[21]; тем временем как у Mai их два: "Emotional" и "Soft".

Фонология

Английский язык

Символ (ARPABET) Классификация МФА эквивалент Пример Примечание
aa гласная ɑ palm
ae гласная æ bat В некоторых диалектах, это может быть /eə/ из-за Æ-tensing (замена /æ/ на /eə/)
ah гласная ʌ but В некоторых диалектах, это может быть ɜ или ɐ
ao гласная ɔː bought Этот гласный имеет множество вариаций в зависимости от диалекта. В американских диалектах это варьируется между /ɑ/ из-за cot–caught merger и /ɒ~ɔ/.
ax гласная ə
ih гласная ɪ bit
iy гласная beat
eh гласная ɛ bet
er гласная əɹ, ɚ или ɝ bird R-colored шва
uh гласная ʊ book
uw гласная ʉ или boot
aw дифтонг aʊ̯ about
ay дифтонг aɪ̯ bite
ey дифтонг eɪ̯ hey
ow дифтонг oʊ̯~o boat
oy дифтонг ɔɪ̯ boy
b согласная b buy
ch согласная ʧ china
d согласная d die
dx согласная ɾ butter Аллофон /t/ или /d/. См. Одноударные согласные
dr согласная d̠ɹ drive Первоначально введено для различения группы согласных в начале и между словами.[22] Реализации могут различаться в зависимости от войсбанка, от [23] до полного удаления звука /r/.
dh согласная ð the Реализации могут различаться в зависимости от войсбанка.
f согласная f fight
g согласная g guy
hh согласная h high
jh согласная ʤ just
k согласная k kite Реализации (придыхательные, непридыхательные, апплозивные) зависят от фонологического контекста.
l согласная l lie Реализации (звонкий зубной, альвеолярный и посталвеолярный латеральный аппроксимант, "dark" или "clear") зависят от фонологического контекста.
m согласная m my
n согласная n nose
ng согласная ŋ sing
p согласная p pie Реализации (придыхательные, непридыхательные, апплозивные) зависят от фонологического контекста.
r согласная ɹ risk Реализации могут различаться на разных войсбанках. См. Ротические согласные
s согласная s say
sh согласная ʃ shy
t согласная t tie Реализации (придыхательные, непридыхательные, апплозивные) зависят от фонологического контекста.
tr согласная t̠ɹ tree Первоначально введено для различения группы согласных в начале и между словами.[22] Реализации могут различаться в зависимости от войсбанка, от [23] до полного удаления буквы /r/.
th согласная θ thing Реализации могут различаться на разных войсбанках.
v согласная v vote
w согласная w wise
y согласная j yes
z согласная z zoo
zh согласная ʒ measure

Также см. Английская фонология

Японский язык

Символ (Ромадзи) Классификация МФА эквивалент Пример Примечание
a гласная ä a
i гласная i i
u гласная ɯᵝ или ɯ͡β u
e гласная e
o гласная o
N слоговая согласная ɴ или ŋ n
t согласная t ta
d согласная d da
s согласная s sa
sh согласная ɕ или ʃʲ しゃ sha Палатализованная /s/
j согласная ʥ или ʑ или ʒʲ ji
z согласная z za
ts согласная ʦ tsu
k согласная k ka
g согласная ɡ ga Некоторые японские певцы часто назализуют этот согласный. Механизм Synthesizer V также имитирует это явление, назализуя согласную в зависимости от голосовой базы данных, делая предположения на основе контекста.
h согласная h ha
b согласная b ba Некоторые японские певцы часто ослабляют этот согласный. Механизм Synthesizer V также имитирует это явление, ослабляя согласную в зависимости от голосовой базы данных, делая предположения на основе контекста.
p согласная p pa
f согласная ɸ ふぁ fa
ch согласная ʨ ちゃ cha Палатализованный /t/
ry согласная ɾʲ りゃ rya Палатализованный /r/
ky согласная きゃ kya Палатализованный /k/
py согласная ぴゃ pya Палатализованный /p/.
dy согласная でゃ dya Палатализованный /d/
ty согласная てゃ tya Палатализованный /t/
ny согласная ɲ или nʲ にゃ nya Палатализованный /n/
hy согласная ç ひゃ hya Палатализованный /h/
my согласная みゃ mya Палатализованный /m/
gy согласная ɡʲ ぎゃ gya Палатализованный /ɡ/
by согласная びゃ bya Палатализованный /b/
n согласная n na
m согласная m ma
r согласная ɾ или ɺ ra
v согласная v vu Отсутствует в японском языке
w согласная w͍ или wᵝ wa Похож на /u/, японская /w/ сжатая.
y согласная j ya
kw согласная くゎ kwa Лабиализованная /k/. Введено в Synthesizer V Studio. Плохо работает в ранних голосовых базах данных. В настоящее время неизвестно, исправили ли это уже последующие обновления – особенно для голосовых баз данных AI.
gw согласная ɡʷ ぐゎ gwa лабиализованная /ɡ/. Введено в Synthesizer V Studio. Плохо работает в ранних голосовых базах данных. В настоящее время неизвестно, исправили ли это уже последующие обновления – особенно для голосовых баз данных AI.
Символ (X-SAMPA)[24] Классификация МФА эквивалент Пример Примечание
a гласная a a, 而 er
A гласная ɑ ang
o гласная o 我 wo
@ гласная ə en
e гласная e 黑 hei
7 гласная ɤ 饿 e
U гласная ʊ 红 hong
u гласная u 无 wu
i гласная i 一 yi
i\ гласная 四 si
i` гласная ʐ̩ 十 shi
y гласная y 与 yü
AU дифтонг 好 hao
@U дифтонг ou
ia дифтонг ia 家 jia
iA дифтонг 将 jiang
iAU дифтонг jaʊ 小 xiao
ie дифтонг je 些 xie
iE дифтонг 前 qian
iU дифтонг 穷 qiong
i@U дифтонг joʊ 就 jiou
y{ дифтонг ɥæ 远 yuan
yE дифтонг ɥɛ 先 xian
ua дифтонг wa 华 hua
uA дифтонг 狂 kuang
u@ дифтонг 顺 shun
ue дифтонг we 对 dui
uo дифтонг wo 多 duo
:\i полугласный ɪ 还 hai, , 北 bei
r\` согласный финаль ɻ 而 er См. Эризация
:n согласный финаль ◌̃ 安 an, 恩 en
N согласный финаль ŋ 横 heng
p согласный инициаль p bo
ph согласный инициаль po придыхательный /p/
t согласный инициаль t de
th согласный инициаль te придыхательный /t/
k согласный инициаль k ge
kh согласный инициаль ke придыхательный /k/
ts` согласный инициаль ʈʂ zhi
ts`h согласный инициаль ʈʂʰ chi придыхательный /ts`/
ts согласный инициаль t͡s zi
tsh согласный инициаль t͡sʰ ci придыхательный /ts/
ts\ согласный инициаль jiao
ts\h согласный инициаль tɕʰ qu придыхательный /ts\/
x согласный инициаль x he также произносится как /h/
f согласный инициаль f fo
s согласный инициаль s si
s` согласный инициаль ʂ shi
s\ согласный инициаль ɕ xiao
m согласный инициаль m mo
n согласный инициаль n ne
l согласный инициаль l le
z` полугласный ʐ ri также произносится как ɻ
w полугласный w wa
j полугласный j ya
Символ (X-SAMPA) Классификация МФА эквивалент Пример Примечание
ts согласный инициаль ts zi
tsh согласный инициаль tsʰ ci придыхательный /ts/
f согласный инициаль f fung
h согласный инициаль h ho
s согласный инициаль s syut
l согласный инициаль l le
m согласный инициаль m ming
n согласный инициаль n nin
N согласный финаль ŋ ngoi
w полугласный w wing
j полугласный j jat
p согласный инициаль p bat
ph согласный инициаль pei придыхательный /p/
t согласный инициаль t doi
th согласный инициаль 禿 tuk придыхательный /t/
k согласный инициаль k gau
kh согласный инициаль kei придыхательный /k/
kw согласный инициаль gwaa лабиализованная /k/
kwh согласный инициаль kʷʰ kwaa лабиализованная придыхательная /k/
a гласная a 责 zaak
6 гласная ɐ 周 zau
E гласная ɛ 些 se
e гласная e 伾 pei
i гласная i 兒 ji
I гласная ɪ 升 sing
O гласная ɔ 开 hoi
o гласная o 數 sou
u гласная u 潰 kui
U гласная ʊ ⽤ jung
9 гласная œ 约 joek
8 гласная ɵ 摔 seot
y гласная y 雪 syut
m= полугласная m слоговой согласный /m/
N= полугласная ŋ̍ ng слоговой согласный /N/
:i финаль ⼥ neoi
:u финаль u: 好 hou
:m финаль m: 闪 sim долгий согласный /m/
:n финаль n: 新 san долгий согласный /n/
:N финаль ŋ: ⻛ fung долгий согласный /N/
:p_} финаль 汁 zap апплозивный /p/
:t_} финаль 雪 syut апплозивный /t/
:k_} финаль 责 zaak апплозивный /k/
Символ (X-SAMPA) Классификация МФА эквивалент Пример Примечание
a гласный a paz
e гласный enero
i гласный i finca, mío
o гласный foco, oído
u гласный u musa, dúo
U полугласный w huevo, buitre, güiro, pausa, neutro
I полугласный j amplio, ciudad, aire, muy
y полугласный ʎ европейские и андские диалекты испанского:
llave, pollo
Встречается в европейском испанском и некоторых диалектах горного хребта Анд (например, внутри страны и в горах Колумбии).
ll полугласный ʝ ayuno; многие латиноамериканские диалекты:llave, pollo Также аллофон /ʎ/ в большинстве диалектов латиноамериканского испанского (особенно в Чили) из-за лингвистического явления, называемого Йеизм. В диалекте риоплатского испанского (Аргентина и Уругвай) вместо этого он реализуется как /ʒ/ или /ʃ/
b согласная b bestia, embuste, vaca, envidia В начале слова, после паузы или после носового согласного.
B согласная β~β̞ bebé, obtuso, vivir, curva В середине слова во всех случаях, когда /b/ не используется.
d согласная dedo, cuando, aldaba В начале слова, после паузы, после носового согласного, или после /l/.
D согласная ð~ð̞ dedo, arder, admirar В середине слова во всех случаях, когда /d/ не используется.
g согласная ɡ gato, lengua, guerra В начале слова, после паузы, или после носового согласного
k согласная k caña, quise, kilo
p согласная p perro, apto
t согласная tuyo, traba
l согласная l lana, principal
rr согласная r rumbo, carro, honra, alrededor, disruptivo, Azrael В начале слова или после носового согласного /l/, /s/ или /θ/. Удваивается, только если он указан двойной буквой R.
r согласная ɾ caro, bravo, Amor eterno
m согласная m mamá, campo, invertir Также аллофон /n/ перед губными согласными
n согласная n nido, sin Включает различные аллофоны: /n/ в начале слова или после паузы /ɲ/ или /nʲ/ перед небными, например /ʎ/ или /ʝ/, или перед постальвеолярными, например /ʧ/, /ʃ/, /ʒ/ или /ʤ/. /ŋ/ перед такими велярными знаками, как /x/, /k/, /g/ или /ɣ/. /n̪/ перед зубными, такими как /d̪/, /ð/ или /t̪/
N согласная ŋ ángulo, palanca; европейские и северно-мексиканские диалекты: manjar Аллофон /n/ в конце слога перед велярными звуками, такими как /x/, /k/, /g/ или /ɣ/
J согласная ɲ ñandú, enyesar Также аллофон /n/ перед небными, например /ʎ/ или /ʝ/, или перед постальвеолярными, например /ʧ/, /ʃ/, /ʒ/ или /ʤ/
f согласная f fase, café
s согласная s casa, xilófono; американские и латиноамериканские диалекты: cerro, cima, zumo, paz Также используется в латиноамериканском и американском диалектах вместо /θ/
C согласная θ Европейские диалекты: cerro, cima, zumo, paz Используется только в европейском испанском; Чтобы это в Synthesizer V Studio по умолчанию, необходимо установить флажок «Использовать европейское произношение» (Use European pronunciation) после выбора испанского языка в качестве языка пения. /s/ используется вместо /θ/ в американском и латиноамериканском испанском.
sh согласная ʃ Xela, shopping Деаффрицированный вариант /ʧ/ в некоторых диалектах. Используется аллофон /ʝ/ и /ʎ/ в риоплатских диалектах (особенно среди молодежи Буэнос-Айреса, Аргентина) из-за sheísmo
ch согласная ʧ chancho
x согласная x jamón, reloj, género, México Европейская испанская фонема, сохранившаяся также в северных мексиканских и перуанских диалектах; не используется в большинстве других диалектов латиноамериканского испанского языка, где вместо этого используется /h/; /h/ самый распространенный аллофон /x/, встречающийся в Соединенных Штатах и большинстве других диалектов латиноамериканского испанского языка (особенно южно-мексиканских, колумбийских, карибских и других прибрежных диалектов) из-за аспирации. Также аллофон /s/ в некоторых диалектах дебукализируется

Корейский язык [25]

Символ (X-SAMPA) Классификация МФА эквивалент Пример Хангыль Примечание
a гласный a bam В быстрой речи звучит как /ɐ/
6 гласный ɐ haru 하루 Короткий /a/
V гласный ʌ geol 거울
@ гласный ə eoreun 어른 Аллофон /ʌ/
E гласный ɛ и (или) e/e̞ gaeguri 개구리 Различие между /e/ и /ɛ/ теряется в южнокорейских диалектах — оба чаще всего реализуются как /e̞/, но некоторые носители языка старшего возраста все еще сохраняют разницу; что касается северокорейского диалекта, некоторые работы сообщают, что различие является устойчивым. Примечательно, что у пожилых ведущих Ли Чхун Хи и даже Ким Чен Ына /e/ и /ɛ/ слились.
e гласный e/e̞ meju 메주 Различие между /e/ и /ɛ/ теряется в южнокорейских диалектах — оба чаще всего реализуются как /e̞/, но некоторые носители языка старшего возраста все еще сохраняют разницу; что касается северокорейского диалекта, некоторые работы сообщают, что различие является устойчивым. Примечательно, что у пожилых ведущих Ли Чхун Хи и даже Ким Чен Ына /e/ и /ɛ/ слились.
i гласный i huinsaek 흰색
o гласный o oneul 오늘
2 гласный ø soenoe 쇠뇌
u гласный u umul 우물
M гласный ɯ beodeul 버들
y гласный y gwienmal 귀엣말
b согласный b ibul 이불
B согласный β ohu 오후 /ɸ/ - аллофон /h/ перед /u/ и /w/
C согласный ç hyungnae 흉내 Аллофон /h/ перед /i/ и /j/
s\ согласный ɕ siru 시루 Аллофон /h/ перед /i/ и /j/
s\_> согласный ɕ͈ ssi Напряженный /ɕ/
d согласный d mindeulle 민들레 /t/ становится /d/ только в середине слова
dz согласный dz najung 나중 /ts/,/ts͈/, /tsʰ/, /dz/ встречаются в северокорейском диалекте
dz\ согласный abeoji 아버지
p\ согласный ɸ hwal Аллофон /h/ перед /u/ и /w/
g согласный g magae 마개 /k/ становится /g/ только в середине слова
G согласный ɣ aga 아가 Произносится, когда ㅎ между звонкими звуками
h согласный h haennip 햇잎
h\ согласный ɦ maheun 마흔 Произносится, когда ㅎ между звонкими звуками
j согласный j yeoul 여울
j согласный ʝ gamhi 감히 Произносится, когда ㅎ между звонкими звуками
k согласный k gui 구이
k_} согласный bajirak 바지락 Апплозивный /k/
k_> согласный kkwong Напряженный /k/
k_h согласный seokhoe 석회 Придыхательный /k/
l` согласный ɭ Silla 신라 В конце слова или между ㄴ и ㄹ
m согласный m mot ㅂ становится /m/ перед /n/ или /m/
n согласный n nuri 누리 ㄹ может быть /n/ в начале слова. ㄷ, ㅅ, ㅈ становятся /n/ перед /n/ или /m/.
N согласный ŋ garangbi 가랑비 ㅇ становится /ŋ/ в конце слога. ㄱ становится /ŋ/ перед /n/, /m/, или /ɾ/
p согласный p bada 바다
p_} согласный busap 부삽 Апплозивный /p/; ㅂ и ㅍ становятся /p̚/ в конце слога
p_> согласный ppul Напряженный /p/
p_h согласный puseori 푸서리 Придыхательный /p/
4 согласный ɾ yeodeure 여드레
s_h согласный subak 수박 Придыхательный /s/
s_> согласный ssal Напряженный /s/
t согласный t dol
t_} согласный got Апплозивный /t/
t_> согласный tteok Напряженный /t/
t_h согласный gutaeyeo 구태여 Придыхательный /t/
ts согласный ts cheukjeong 측정 /ts, ts͈, tsʰ, dz/ встречаются в северокорейском диалекте.
ts_> согласный ts͈ jjallim 짤림 Напряженный /ts/; /ts, ts͈, tsʰ, dz/ встречаются в северокорейском диалекте.
ts_h согласный tsʰ chamsae 참새 Придыхательный /ts/; /ts, ts͈, tsʰ, dz/ встречаются в северокорейском диалекте.
t_s\ согласный jaturi 자투리
t_s\_> согласный tɕ͈ doljjeogwi 돌쩌귀 Напряженный /tɕ/
t_s\_h согласный tɕʰ nunchori 눈초리 Придыхательный /tɕ/
w согласный w waegari 왜가리 /w/ пишется ㅜ перед /ʌ/, /e/, /i/ (последняя комбинация даёт /y/ ~ /ɥi/) и ㅗ перед /ɛ/, /a/; ㅚ /ø/ также может произноситься как /we/.
x согласный x heuk Аллофон /h/ перед /ɯ/

Дополнительные фонемы

Символ Классификация МФА эквивалент Пример Примечание
cl геминация или согласная ʔ uh-oh Удлиняет следующую согласную. Действует как ʔ. Плохо работает в старом редакторе Synthesizer V
br Дыхание
brl Долгое дыхание
sil Тишина

Голосовые банки

Synthesizer V

  • Элеонора Форте (англ. Eleanor Forte, яп. エレノア フォルテ, кит. 愛蓮娜芙緹[26]), также известная под кодовым названием ENG-F1 — самый первый английский женский голосовой банк для Synthesizer V, разработанная Dreamtonics Co. Ltd. и распространяемая VOLOR 18 августа 2018 года. Является единственным банком Synthesizer V, доступная на английском языке. Изображается с серебряными волосами в чёрно-белой одежде. Нитка, которую она держит в руках, не что иное как красная нить судьбы, элемент восточных мифов. Рекомендаций по диапазону не дано. Эксперименты пользователей показали, что Элеонора Форте способна пропевать даже сложные оперные арии наподобие таковых из «Призрака Оперы»[18][27][28]. Была обновлена до Synthesizer V Studio (Standard) 30 июля 2020 года. Получила ИИ войсбанк 6 декабря 2021 года.
  • Рэнри Яминэ (яп. 闇音レンリ) — первый японский женский вокал, разработанная Dreamtonics Co. Ltd. и распространяемая VOLOR 11 ноября 2018 года. Её голосовым провайдером является певица, выступающая под псевдонимом Yuzuri. Изначально была представлена 28 сентября 2014 года в составе движка UTAU. Была обновлена для Synthesizer V Studio (Standard) 13 октября 2021 года.
  • Гэнбу (яп. ゲンブ), также известный как Kurono Takehiro (玄野武宏) — японский мужской вокал, разработанный и распространяемый VOLOR. Его голосовым провайдером является певец, выступающий под псевдонимом Gallo. Был выпущен 23 декабря 2018 года, 15 июля 2020 года обновлен для Synthesizer V Studio (Standard). Он стал частью проекта VirVox в мае 2021 года. Его ИИ войсбанк был отменен.
  • Айкэ (кит. упр. 艾可, пиньинь Àikě, яп. アイコ) — севернокитайский женский вокал с тайваньским акцентом и талисман компании «Animen», разработанная и распространяемая VOLOR[29]. Первый севернокитайский вокал Synthesizer V. Её голосовым провайдером является певица Лян Сяомяо (кит. 梁小喵). Была выпущена 28 декабря 2018, 15 июля 2020 года обновлена до Synthesizer V Studio (Standard). Рекомендаций по диапазону не дано.
  • Чиюй (кит. упр. 赤羽, пиньинь Chìyǔ, яп. チーユ) — севернокитайский женский вокал, разработанная и распространяемая Beijing Photek S&T Development Co., Ltd.; Младшая сестра Цанцюн. Её голосовым провайдером является певица, выступающая под псевдонимом Юмао Юнэко (кит. 呦猫UNEKO). Была выпущена 30 апреля 2019 года. Олицетворяет стихию огня. Была обновлена до Synthesizer V Studio(Standard) 10 июля 2020 года. Разработка для ее ИИ войсбанка была заморожена.
  • Шиань (кит. упр. 诗岸, пиньинь Shīàn, яп. シアン) — севернокитайский женский вокал разработанная Beijing Photek S&T Development Co., Ltd; младшая сестра Хайи. Её голосовым провайдером является певица, выступающая под псевдонимом warma. Была выпущена 20 июня 2019 года. Олицетворяет стихию земли. Была обновлена для Synthesizer V Studio (Standard) 10 июля 2020 года.
  • Цанцюн (кит. упр. 苍穹, пиньинь Cāngqióng, яп. ツァンチォン) — севернокитайский женский вокал, разработанная и распространяемая компанией Beijing Photek S&T Development Co., Ltd. Её голосовым провайдером является певица, выступающая под псевдонимом Киноко Могу (кит. Kinoko_蘑菇). Была выпущена 9 июня 2019 года в составе пакета «Medium⁵». Хайи, Шиань и Чиюй приходятся ей младшими сёстрами. Олицетворяет стихию воздуха. Была обновлена для Synthesizer V Studio (Standard) 10 июля 2020 года.
  • Хайи (кит. упр. 海伊, пиньинь Hǎiyī, яп. ハイー) — севернокитайский женский вокал, младшая сестра Чиюй. Её голосовым провайдером является певица, выступающая под псевдонимом Хуачжэн Анли (кит. 花筝Anly). Была выпущена 6 сентября 2019 года. Олицетворяет стихию воды. Была обновлена для Synthesizer V Studio (Standard) 10 июля, 2020 года. 3 января 2025 года она получила ИИ войсбанк для Synthesizer V Studio.

Synthesizer V Studio

  • Саки (яп. サキ) — японский женский вокал, разработанная и выпущенная Dreamtonics изначально исключительно для веб-версии Synthesizer V 31 декабря 2019 года. Официальное имя было присвоено ей только после выпуска Synthesizer V Studio 30 июля 2020 года (Standard)[30]. 25 декабря 2020 года она получила ИИ войсбанк. Ее планируют обновить до Synthesizer V Studio 2 21 марта 2025 года. Голосовой провайдер неизвестен.
  • Аканэ и Аой Котоноха (яп. 琴葉 茜 ・ 葵) — дуэт японских женских вокалов, имеющих только один голосовой банк, изначально представленных в составе движка VOICEROID. Голосовым провайдером обеих является певица Юи Сакакибара (яп. 榊原ゆい). Были выпущены 30 июля 2020 года со Standard войсбанком.
  • Мусинь (кит. упр. 牧心, пиньинь Mùxīn, яп. ムーシン) — севернокитайский мужской вокал. Его голосовым провайдером является певец, выступающий под псевдонимом YuukaNeko. Был выпущен 15 августа 2020 года со Standard войсбанком.
  • Минус, также известная как Yongye Minus кит. 永夜Minus), а до ноября 2023 года — Xingchen Minus (уп. кит.: 星尘Minus или Stardust Minus) — севернокитайский женский вокал, разработанная и распространяемая Beijing Photek S&T Development Co., Ltd. и выпущенная в качестве Standard войсбанка для Synthesizer V Studio 10 сентября 2020 года. Она входит в состав MEDIUM⁵. Ожидалось, что Минус получит частный войсбанк ИИ, обученный по Standard, для Synthesizer V Studio, известную как Xingchen Minus Synthesizer V Plus, но никакой информации о разработке предоставлено не было. Вместо этого она получила войсбанк ИИ в декабре 2023 года.
  • Рикка Кохару (яп. 小春六花) — японский женский вокал разработанный AHS Co. Ltd. По концепции, ученица второго класса вымышленной средней школы Отару Сиокадзэ (яп. 小樽潮風高校)[31]. Её голосовым провайдером является японская сэйю и певица Ёсино Аояма. Доступна как в версии Lite (как стандартный, так и AI-вариант для Studio Basic), так и в качестве полноценного голоса для Synthesizer V Standard/Synthesizer V AI. Была выпущена 18 марта 2021 года для Synthesizer V и CeVIO AI. Также доступна как голос для движка VOICEPEAK с 13 июля 2023 года.
  • Маки Цурумаки (яп. 弦巻マキ) — японский и английский женский вокал, разработанный и распространяемый AHS Co. Ltd 18 июня 2021 года. Изначально была представлена в составе движка VOICEROID. Имеет двух голосовых провайдеров: Томоэ Тамиясу (яп. 民安ともえ) в VOICEROID и Минами Танаку (яп. 田中真奈美) в Synthesizer V[32][33][34].
  • Сэйка Кёмати (яп. 京町セイカ) — японский женский вокал, разработанный и распространяемый AHS Co. Ltd. Изначально являлась талисманом посёлка Сейка, расположенного в префектуре Киото. Позднее стала персонажем манги и голосовым помощником. Была представлена в составе движка VOICEROID благодаря народному сбору пожертвований, итоговая сумма которых превысила изначально требуемую больше, чем в два раза. Новая краудфандинговая компания, направленная на выпуск Сэйки в составе Synthesizer V Studio, снова превысила изначально необходимую сумму[35][36][37][38]. Была выпущена 27 января 2022 года с AI/Standard банками. Ее планируют обновить до Synthesizer V Studio 2[39].
  • Цуйна-тян (яп. ついなちゃん) — японский женский вокал, созданная на основе голоса актрисы Маи Кадоваки. Была выпущена 26 ноября 2021 года компанией AHS Co., Ltd. Образ Цуйны-тян был создан на основе японского праздника сэцубун в январе 2011 году под влиянием Хацунэ Мику. Автор оригинала - художник и иллюстратор манги Рисаки Оэнри.

Synthesizer V Studio AI

  • Цин Су (кит. упр. 青溯, пиньинь Qing Su), также известный как MAN-F3 — севернокитайский женский вокал, разработанная и распространяемая компанией Dreamtonics Co., Ltd. и выпущенная в качестве базы данных голосов ИИ для Synthesizer V Studio 1 декабря 2021 года. В январе 2025 года было объявлено, что Qing Su получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Qing Su 2, и было объявлено, что оно будет выпущено одновременно с новым редактором 21 марта 2025 года. Ее голосовой провайдер неизвестен.
  • Анри (англ. ANRI), также известная как Айри Лин — английский женский вокал, разработанный и распространяемый AUDIOLOGIE Co., Ltd. и выпущенная в качестве базы данных голосов ИИ для Synthesizer V Studio 11 декабря 2021 года. Она получила новую автономную базу данных голосов для Synthesizer V Studio под названием ANRI Arcane 11 декабря 2023 года; ее оригинальная база данных голосов (за исключением версии Lite) с тех пор была прекращена. Памятное коллекционное издание для ANRI Arcane под названием ANRI Arcane Redux было объявлено о предварительном заказе в июне 2024 года в честь дня рождения персонажа ANRI и было объявлено о выпуске в октябре 2024 года. Ее голосовой провайдер kurapichu.
  • SOLARIA — английский женский вокал, разработанный и распространяемый Eclipsed Sounds, LLC и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 19 января 2022 года. Она является первым вокалом, выпущенным в рамках серии баз данных голосов Starry Court от Eclipsed Sounds. Ожидается, что обновленная версия для предстоящего Synthesizer V Studio 2 выйдет 21 марта 2025 года. Ее озвучивает Эмма Роули — американская певица, автор песен, поп-артистка и артистка Бродвея.
  • Рё (яп. リョウ; англ. Ryo) — японский мужской вокал, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 4 февраля 2022 года. В январе 2025 года было объявлено, что Ryo получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Ryo 2, и было объявлено, что он будет выпущен одновременно с новым редактором 21 марта 2025 года. Его голосовой провайдер не разглашается.
  • Кевин — английский мужской вокал, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 4 февраля 2022 года. В январе 2025 года было объявлено, что Кевин получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Kevin 2, и было объявлено, что он будет выпущен одновременно с новым редактором 21 марта 2025 года. Имя его голосового провайдера не разглашается, но подтверждено, что у Кевина американский акцент.
  • Синчэнь (кит. упр. 星尘, пиньинь Xīng chén, яп. シーンチェン・マイナス), также известная на английском языке как Stardust, — севернокитайский женский вокал, разработанный и распространяемый Beijing Photek S&T Development Co., Ltd. и выпущенный как голосовая база данных AI (известная как Xingchen Infinity) для Synthesizer V Studio 20 февраля 2022 года. Ранее она была выпущена как голосовой банк VOCALOID4 в апреле 2016 года и была первым и единственным продуктом компании для Vocaloid. Позже она вошла в состав MEDIUM⁵.
  • Мо Чэнь (кит. упр. 默辰, пиньинь Mo Chen), также известный как MAN-M2, — севернокитайский мужской вокал, разработанный и распространяемый компанией Dreamtonics Co., Ltd. и выпущенная в качестве базы данных голосов ИИ для Synthesizer V Studio 9 апреля 2022 года. В январе 2025 года было объявлено, что Mo Chen получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Mo Chen 2, и было объявлено, что оно будет выпущено одновременно с новым редактором 21 марта 2025 года. Его голосовой провайдер не разглашается.
  • Нацуки Карин (Natsuki Karin (яп. 夏色花梨)) — японский женский вокал, разработанный и распространяемый компанией TOKYO6 ENTERTAINMENT в сотрудничестве с AH Software[англ.] и выпущенная в качестве базы данных голосов ИИ для Synthesizer V Studio 13 апреля 2022 года. В тот же день она также была выпущена в качестве речевого банка голосов для CeVIO AI. Ее озвучивает Мию Такаги, японская актриса озвучивания.
  • Ан Сяо (кит. упр. 岸晓, пиньинь An Xiao) — севернокитайский мужской вокал, разработанный и распространяемый компанией Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 4 мая 2022 года. В феврале 2025 года было объявлено, что An Xiao получит обновление для также готовящегося к выпуску движка Synthesizer V Studio 2, представленного как An Xiao 2, и было объявлено, что он будет выпущен одновременно с новым редактором 21 марта 2025 года. Его голосовой провайдер не разглашается.[20][40]
  • Фэн И (Упрощенный китайский: 沨漪; традиционный китайский: 渢漪; англ. Feng Yi) — севернокитайский женский вокал, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 27 мая (для Материкового Китая)/29 мая (Мир) 2022 года. В феврале 2025 года было объявлено, что Feng Yi получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Feng Yi 2, и было объявлено, что он будет выпущен одновременно 21 марта 2025 года. Имя ее голосового провайдера не разглашается.
  • Вэйна — это севернокитайский и английский женский вокал, разработанный и распространяемый Dreamtonics Co., Ltd. в сотрудничестве с Ready Steady Sound! и Sound & Vision Media Studio, и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 21 июля 2022 года. Она является частью Synthesizer V AI Gold Series. В феврале 2025 года было объявлено, что Weina получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Weina 2, и было объявлено, что она будет выпущен одновременно с новым редактором 21 марта 2025 года. Её озвучивает Вэйна Ху, китайская актриса и певица, которая также является вокальным директором проекта Вэйны.
  • Юма (японск. ユウマ; англ. Yuma) — японский мужской вокал, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 7 октября 2022 года. В феврале 2025 года было объявлено, что Yuma получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Yuma 2, и было объявлено, что он будет выпущен одновременно с новым редактором 21 марта 2025 года. Его голосовой провайдер не разглашается.
  • Натали (англ. Natalie) — английский женский вокал, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 7 октября 2022 года. В декабре 2024 года было объявлено, что Natalie получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Natalie 2, и было объявлено, что она будет выпущена одновременно с новым редактором 21 марта 2025 года. Хотя изначально имя ее голосового провайдера не было раскрыто, в мае 2024 года американская певица и музыкант по имени Натали Николь Гилберт сообщила, что она является голосовым провайдером для Натали.[41] Dreamtonics признали это в электронном письме, опубликованном в ее аккаунте Twitter 10 мая.[42]
  • Ханакума Тифую (японск. 花隈千冬; англ. Hanakuma Chifuyu) — японский женский вокал, разработанная и распространяемая TOKYO6 ENTERTAINMENT в сотрудничестве с AH-Software Co. Ltd. и выпущенная в качестве базы данных голосов ИИ для Synthesizer V Studio 20 октября 2022 года. Она также выпущена в качестве речевого банка для CeVIO AI. Ее озвучивает Кая Окуно, японская актриса озвучивания.
  • Май — японский женский вокал, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов AI для Synthesizer V Studio 10 ноября 2022 года. В январе 2025 года было объявлено, что Mai получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Mai 2, и было объявлено, что она будет выпущена одновременно с новым редактором в качестве одной из трех бесплатных стартовых войсбанков (в дополнение к Liam и Mo Xu) 21 марта 2025 года. Также было объявлено, что платная версия будет доступна для тех, кто не выбрал Mai в качестве бесплатной стартовой базы голосов. Ее голос озвучивает японская певица и автор песен Хонока Китта.
  • Астериан (англ. ASTERIAN) — английский мужской вокал, разработанный и распространяемый Eclipsed Sounds, LLC и выпущенный в качестве базы данных голосов AI для Synthesizer V Studio 2 декабря 2022 года. Он является вторым вокалом, выпущенным в рамках серии баз данных голосов Starry Court от Eclipsed Sounds после SOLARIA. Ожидается, что обновленная версия для предстоящего Synthesizer V Studio 2 выйдет в марте 2025 года. Его озвучивает Эрик Холлауэй, американский актёр озвучивания и певец.
  • Сюань Ю (кит. 煊宇; англ. Xuan Yu) — севернокитайский мужской вокал, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 12 декабря 2022 года. В феврале 2025 года было объявлено, что Xuan Yu получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Xuan Yu 2 , и было объявлено, что он будет выпущен одновременно с новым редактором 21 марта 2025 года. Его голосовой провайдер не разглашается.
  • Цон Чжэн (кит. уп: 從錚; англ. Cong Zheng) — севернокитайский женский вокал, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 12 декабря 2022 года. В феврале 2025 года было объявлено, что Cong Zheng получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2,представленного как Cong Zheng 2 , и было объявлено, что он будет выпущен одновременно с новым редактором 21 марта 2025 года. Имя ее голосового провайдера не разглашается.
  • Чэн Сяо (кит. 澄宵; англ. Cheng Xiao) — севернокитайский женский вокал для пекинской оперы, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 8 январе (для Материкового Китая)/16 Февраля (Мир) 2023 года. В феврале 2025 года было объявлено, что Cheng Xiao получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Cheng Xiao 2, и было объявлено, что она будет выпущена одновременно с новым редактором 21 марта 2025 года. Имя ее голосового провайдера не разглашается.
  • Ся Ю Яо (кит. трад.: 夏語遙; англ. XIA YU YAO), также известная как YAO для Synthesizer V – севернокитайский женский вокал, разработанный и распространяемый VOICEMITH, группой планирования под управлением E-CAPSULE Co. Ltd., и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 30 января 2023 года. Первоначально она была выпущена для движка Utau в ноябре 2014 года. Ее озвучивает актриса озвучивания Ми Ян. Она второй вокал после Айкэ, имеющий тайваньский акцент. Ее планируют обновить до Synthesizer V Studio 2.
  • Ninezero — это английский мужской вокал для рока и металла, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 16 февраля 2023 года. В январе 2025 года было объявлено, что Ninezero получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Ninezero 2 , и было объявлено, что он будет выпущен одновременно с новым редактором 21 марта 2025 года. Его голос озвучил NINEZERO, австралийский рок- и метал-певец, автор песен и музыкант.
  • Джун (англ. JUN), также известный как Juneau Kheang — английский мужской вокал, разработанный и распространяемый компанией AUDIOLOGIE Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 20 апреля 2023 года. Его голосовой провайдер — Lavy.
  • Касанэ Тето (японск. 重音テト; англ. Kasane Teto) — японский женский вокал, разработанная и распространяемая AH-Software Co. Ltd. в сотрудничестве с TWINDRILL и выпущенная в качестве голосовой базы данных ИИ для Synthesizer V Studio 27 апреля 2023 года. Первоначально она была выпущена для движка Utau в апреле 2008 года. Ее озвучивает японская певица, автор песен и иллюстратор Оямано Майо.
  • Линь Лай (кит. упр.: 林籁; кит. трад.: 林籟, пиньинь Lin Lai) — севернокитайский мужской детский вокал, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 17 июня (для Материкового Китая)/26 октября (Мир) 2023 года. В феврале 2025 года было объявлено, что Lin Lai получит обновление для также готовящегося к выпуску движка Synthesizer V Studio 2, представленного как Lin Lai 2, и было объявлено, что он будет выпущен одновременно с новым редактором 21 марта 2025 года. Его голосовой провайдер не разглашается.
  • Юнь Чуань (кит. упр: 韵泉; кит. трад.: 韻泉, англ. Yun Quan) — севернокитайский женский детский вокал, разработанный и распространяемый компанией Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 17 июня (для Материкового Китая)/26 октября (Мир) 2023 года. В феврале 2025 года было объявлено, что Yun Quan получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Yun Quan 2 , и было объявлено, что он будет выпущен одновременно с новым редактором 21 марта 2025 года. Имя ее голосового провайдера не разглашается.
  • Ричи (англ. Ritchy) — это английский мужской вокал для рэпа, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 4 июля 2023 года. В январе 2025 года было объявлено, что Ritchy получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Ritchy 2, и было объявлено, что он будет выпущен одновременно с новым редактором 21 марта 2025 года. Его озвучивает MBanja Ritchy — хип-хоп-исполнитель, мастер треков, рэпер и продюсер.
  • D-Lin — это севернокитайский мужской вокал для рэпа, разработанный и распространяемый компанией Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 4 июля 2023 года. В феврале 2025 года было объявлено, что D-Lin получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как D-Lin 2, и было объявлено, что оно будет выпущено одновременно с новым редактором 21 марта 2025 года. Его голосовой провайдер не разглашается.
  • Харуно Сора (яп. 桜乃そら) — японский женский вокал, разработанный и распространяемый компанией AH-Software Co. Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 24 августа 2023 года. Первоначально она была выпущена в виде двух банков для движка VOCALOID5 и речевого банка голосов для движка VOICEROID2 в июле 2018 года. Библиотека голосов для движка VOICEPEAK была выпущена одновременно с ее библиотекой Synthesizer V. Ее озвучивает Кикуко Иноуэ, японская актриса озвучивания и певица.
  • Эри (яп. エリ, англ. Eri) — японский женский вокал для рэпа, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 26 октября 2023 года. В феврале 2025 года было объявлено, что Eri получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Eri 2, и было объявлено, что он будет выпущен одновременно с новым редактором 21 марта 2025 года. Имя ее голосового провайдера не разглашается.
  • Шина (яп. シーナ) — японский и английский женский вокал, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 26 октября 2023 года. В декабре 2024 года было объявлено, что Sheena получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Sheena 2, и было объявлено, что он будет выпущен одновременно с новым редактором 21 марта 2025 года. Имя ее голосового провайдера не разглашается.
  • Хайден (англ. Hayden) — это английский мужской вокал, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 26 октября 2023 года. В январе 2025 года было объявлено, что Hayden получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Hayden 2, и было объявлено, что он будет выпущен одновременно с новым редактором 21 марта 2025 года. Его голосовой провайдер не разглашается.
  • Вэй Шу (кит. 未抒) — это первый кантонский вокал, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 25 октября 2023 года. В феврале 2025 года было объявлено, что Wei Shu получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Wei Shu 2, и было объявлено, что он будет выпущен одновременно с новым редактором 21 марта 2025 года. Его голосовой провайдер не разглашается.
  • Сарос (англ. SAROS) — это небинарный (указанный как мужской) английский и первый испанский вокал, разработанный и распространяемый Eclipsed Sounds, LLC и выпущенный в качестве базы данных голосов AI для Synthesizer V Studio 24 ноября 2023 года. Это третий вокал, выпущенный в рамках серии баз данных голосов Starry Court от Eclipsed Sounds после SOLARIA и ASTERIAN. Ожидается, что обновленная версия для предстоящего Synthesizer V Studio 2 выйдет 21 марта 2025 года. Имя их вокалиста не разглашается, но Eclipsed Sounds описывает его как «успешного музыканта в Нью-Йорке», который «изучал вокал и музыку в одном из ведущих музыкальных колледжей мира, гастролировал по миру, выступая перед тысячами людей, и в настоящее время поет в нескольких группах».
  • Аямэ (яп. アヤメ, аннл. Ayame), ранее известная как Ая — японский женский вокал, разработанная и распространяемая компанией Dreamtonics Co., Ltd. и выпущенная в качестве базы данных голосов ИИ для Synthesizer V Studio 7 декабря 2023 года. В январе 2025 года было объявлено, что Ayame получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2, представленного как Ayame 2, и было объявлено, что оно будет выпущено одновременно с новым редактором 21 марта 2025 года. Имя ее голосового провайдера не разглашается.
  • Дзин (яп. ジン, англ. Jin) — японский мужской вокал, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов AI для Synthesizer V Studio 7 декабря 2023 года. В феврале 2025 года было объявлено, что Jin получит обновление для также готовящегося к выходу движка Synthesizer V Studio 2 , представленного как Jin 2 , и было объявлено, что он будет выпущен одновременно с новым редактором 21 марта 2025 года. Его голосовой провайдер не разглашается.
  • Гуми (яп. グミ, англ. GUMI) — японский женский вокал, разработанная AH-Software Co. Ltd. и распространяемая Internet Co., Ltd. как Megpoid (яп. メグッポイド), и выпущенная как голосовая база данных AI для Synthesizer V Studio 20 декабря 2023 года. Первоначально она была выпущена в июне 2009 года как голосовой банк для движка VOCALOID2; С тех пор она получила дополнительные голосовые банки для VOCALOID3 в октябре 2011 года (за которым последовало обновление ее голоса V2, теперь называемого Native, в марте 2012 года, а также английский голосовой банк в феврале 2013 года), VOCALOID4 в ноябре 2015 года (обновления только для ее японских голосовых банков) и VOCALOID6 в октябре 2022 года (как двуязычный японский и английский вокал AI, за которым позже последовал новый расширенный голосовой банк, названный SOLID в июле 2024 года). Ее голос озвучивает филиппино-японская певица и актриса озвучивания Мэгуми Накадзима.
  • Попи (яп. ポピー; англ. POPY) — японский женский вокал, разработанная и распространяемая Bushiroad Inc. в сотрудничестве с AH-Software Co. Ltd. и выпущенная в качестве базы данных голосов ИИ для Synthesizer V Studio 21 декабря 2023 года. Первоначально она была выпущена в качестве банка голосов для движка CeVIO AI в декабре 2022 года. Она является первым банком, выпущенной в рамках проекта синтезатора пения ИИ BanG Dream! от Bushiroad Inc., Yumenokessho. Ожидается, что обновленная версия для предстоящего Synthesizer V Studio 2 будет выпущена в апреле 2025 года в цифровом формате, а выпуск физического издания ожидается в мае. Ее озвучивает японская певица Айми.
  • Роуз (яп. ローズ; англ. ROSE) — японский женский вокал, разработанная и распространяемая Bushiroad Inc. в сотрудничестве с AH-Software Co. Ltd. и выпущенная в качестве базы данных голосов ИИ для Synthesizer V Studio 21 декабря 2023 года. Первоначально она была выпущена в качестве банка голосов для движка CeVIO AI в декабре 2022 года. Она является вторым вокалом, выпущенным в рамках проекта синтезатора пения ИИ BanG Dream! от Bushiroad Inc., Yumenokessho. Ожидается, что обновленная версия для предстоящего Synthesizer V Studio 2 будет выпущена в апреле 2025 года в цифровом формате, а выпуск физического издания ожидается в мае. Ее озвучивает японская певица Айна Айба.
  • Оскар (кит. 奧斯卡; англ. OSCAR) — севернокитайский мужской вокал, разработанный и распространяемый VOICEMITH, группой планирования под управлением E-CAPSULE Co. Ltd., и выпущенный в качестве базы данных голосов ИИ для Synthesizer V Studio 26 декабря 2023 года. Первоначально он был выпущен для движка Utau в августе 2016 года. Его озвучивает Майлз, тайваньский актёр озвучивания, музыкант и певец. Он третий севернокитайский вокал с тайваньским акцентом после Айкэ и Ся Ю Яо. Его планируют обновить до Synthesizer V Studio 2.
  • И Си (кит. 奕夕; англ. Yi Xi) — это севернокитайский женский вокал для рэпа, разработанный и распространяемый Dreamtonics Co., Ltd. и выпущенный в качестве базы данных голосов AI для Synthesizer V Studio 15 марта 2024 года только для клиентов из Материкового Китая. В феврале 2025 года было объявлено, что Yi Xi 21 марта получит обновление для также готовящегося к выпуску движка Synthesizer V Studio 2, представленного как Yi Xi 2. Имя ее голосового провайдера не разглашается.

Synthesizer V Studio 2

  • Мо Сюй (кит. уп. 陌叙; англ. Mo Xu) — предстоящий севернокитайский женский вокал, который разрабатывается и будет распространяться компанией Dreamtonics Co., Ltd. и выпущен в качестве одной из трех дополнительных баз данных голосов ИИ (две другие — Mai 2 и Liam) для также предстоящего Synthesizer V Studio 2 21 марта 2025 года. Также было объявлено, что платная версия будет доступна для тех, кто решит не выбирать Mo Xu в качестве бесплатной стартовой базы данных голосов. Имя ее голосового провайдера не разглашается. Она создана как идеальная для R&B, неосоула, поп-музыки и подобных жанров.[43]
  • Лиам (англ. Liam) — предстоящий английский мужской вокал, который разрабатывается и будет распространяться Dreamtonics Co., Ltd. и выпущен в качестве одной из трех дополнительных баз данных голосов ИИ (две другие — Mai 2 и Mo Xu) для также готовящегося к выходу Synthesizer V Studio 2 21 марта 2025 года. Также было объявлено, что платная версия будет доступна для тех, кто решит не выбирать Liam в качестве бесплатной стартовой базы данных голосов. Его голосовой провайдер не разглашается. Он создан как "классический западный мужской голос, типичный для поп-, рок- и даже кантри-исполнителей 70-х/80-х годов".[44]
  • мики, также известная как SF-A2 miki (яп. SF-A2 開発コード miki) — предстоящий японский женский вокал, который разрабатывается и будет распространяться AH-Software Co. Ltd. и выпущена в качестве базы данных голосов ИИ для также предстоящего программного обеспечения Synthesizer V Studio 2 21 марта 2025 года (вместе с базой данных голосов ИИ, совместимой со старым движком Synthesizer V Studio). Ранее она была выпущена как один из трех дебютных голосовых банков AH-Software для движка VOCALOID2 (вместе с Hiyama Kiyoteru и Kaai Yuki) в декабре 2009 года; она была обновлена для VOCALOID4 в июне 2015 года. Ее голос предоставлен Мики Фурукавой – японской певицей, автором песен и бывшей участницей группы Supercar.
  • Хияма Кийотеру (яп. 氷山キヨテル, англ. Hiyama Kiyoteru) — предстоящий японский мужской вокал, который разрабатывается и будет распространяться AH-Software Co. Ltd. и выпущен в качестве базы данных голосов ИИ для также предстоящего Synthesizer V Studio 2 21 марта 2025 года (вместе с базой данных голосов ИИ, совместимой со старым движком Synthesizer V Studio). Первоначально он был выпущен как один из трех дебютных голосовых банков AH-Software для движка VOCALOID2 (вместе с miki и Kaai Yuki) в декабре 2009 года; он был обновлен до VOCALOID4 в октябре 2015 года и получил два голосовых банка. Его озвучивает японский певец Киёси Хияма.
  • Юни (кор. 유니, англ. UNI) — предстоящий первый корейский женский вокал, который разрабатывается и будет распространяться компанией ST MEDiA Co., Ltd. и будет выпущен в качестве базы данных голосов ИИ для также готовящегося к выходу программного обеспечения Synthesizer V Studio 2 21 марта 2025 года.[45] Ранее она была выпущена в качестве голосового банка для VOCALOID4 в феврале 2017 года. Имя ее голосового провайдера неизвестно.
  • Хэвик (англ. HXVOC, произносится как havoc) — предстоящий мужской английский вокал, который разрабатывается и будет распространен компанией Eclipsed Sounds, LLC, и который будет выпущен в качестве базы данных голосов ИИ 27 марта 2025 года для также готовящегося к выходу программного обеспечения Synthesizer V Studio 2.[46] Он является первым вокалом, который анонсирован как часть "Фазы 2" специализированных баз данных голосов Eclipsed Sounds, получившей название серии Tone Chroma. Его голос озвучивает рок-певец, автор песен и музыкальный продюсер Шонн Николс.
  • Галенайа (англ. GALENAIA) — предстоящий испанский женский вокал для оперы, которая разрабатывается и будет распространена компанией Eclipsed Sounds, LLC и будет выпущена в качестве базы данных голосов ИИ 27 марта 2025 года для также готовящегося к выходу программного обеспечения Synthesizer V Studio 2. Она является второй вокалисткой, которая анонсирована в рамках "Фазы 2" специализированных баз голосов Eclipsed Sounds, получившей название серии Tone Chroma. Ее озвучивает колумбийская оперная певица Лаура Гомес.
  • Пастел (яп. パステル; англ. PASTEL) — предстоящий японский женский вокал, который разрабатывается и будет распространен Bushiroad Inc. в сотрудничестве с AH-Software Co. Ltd. и будет выпущен в качестве базы данных голосов ИИ для также готовящегося к выходу программного обеспечения Synthesizer V Studio 2 28 марта 2025 года (вместе с базой данных голосов ИИ, совместимой со старым движком Synthesizer V Studio). Она является третьим вокалом, выпущенным в рамках проекта BanG Dream! AI Singing Synthesizer от Bushiroad Inc., Yumenokessho после POPY и ROSE. Ее озвучивает Ами Маэшима.
  • Хало (яп. ハロ; англ. HALO) — предстоящий японский женский вокал, который разрабатывается и будетраспространен Bushiroad Inc. в сотрудничестве с AH-Software Co. Ltd. и будет выпущен в качестве базы данных голосов ИИ для также готовящегося к выходу программного обеспечения Synthesizer V Studio 2 28 марта 2025 года (вместе с базой данных голосов ИИ, совместимой со старым движком Synthesizer V Studio). Она является четвертым вокалом, выпущенным в рамках проекта BanG Dream! AI Singing Synthesizer от Bushiroad Inc., Yumenokessho после POPY, ROSE и PASTEL. Ее озвучивает Мику Ито.
  • Асуми Шуо (яп. 彩澄しゅお) — предстоящий японский женский вокал, который разрабатывается AH Software и будет войсбанком ИИ для также готовящегося к выходу Synthesizer V Studio 2. Её озвучивает Миа Сакурай (櫻井海亜), японская актриса озвучивания, которая сыграла несколько второстепенных ролей в различных аниме-сериалах, таких как BanG Dream! (2-й сезон) и Crayon Shin-chan (30-й сезон), а также Кэрол (キャロル) в мобильной игре Vivid Army. Дата выхода неизвестна.
  • Асуми Ририсэ (яп. 彩澄りりせ; англ Asumi Ririse) — предстоящий японский женский вокал, который разрабатывается и будет распространяться компанией AH-Software Co. Ltd. и будет выпущена войсбанком ИИ для также готовящегося к выходу Synthesizer V Studio 2. Её озвучивает Мотомия Кана (本宮佳奈), актриса озвучивания, известная по роли Мисаки Шидо из Touou Academy в ритм-игре Love Live! School Idol Festival и Фенек Фокс из аниме Kemono Friends. Дата выхода неизвестна.
  • Нацумэ Ицуки (яп. ナツメイツキ; англ. Natsume Itsuki) — предстоящий японский женский вокал, который разрабатывается и будет распространяться компанией Hifumi, Inc. и выпущена войсбанком ИИ для также готовящегося к выходу Synthesizer V Studio 2. Ее озвучивает Ицуки Нацумэ (棗いつき). Дата выхода неизвестна.
  • Накуру (яп. 無來; англ. Nakuru) — предстоящий японский женский вокал, который разрабатывается и будет распространяться компанией Hifumi, Inc. и будет выпущена войсбанком ИИ для также готовящегося к выходу Synthesizer V Studio 2. Ее голос предоставлен певицей Накуру Аицуки. Дата выхода неизвестна.

Отмененные/приватные

  • Кафу (японск. 可不, англ. KAFU) — Отменена. Это был японский женский вокал, который разрабатывался компанией AH-Software Co. Ltd. и должен был распространяться компанией KAMITSUBAKI STUDIO, ее выпуск в качестве голосовой банка ИИ для Synthesizer V Studio ожидался в январе 2024 года, но был отложен на неопределенный срок и отменен в январе 2025 года. Первоначально она была выпущена в качестве голоса для движка CeVIO AI в июле 2021 года. Она является частью проекта Musical Isotope. Ее озвучивает KAF, японская виртуальная певица и исполнитель.
  • Chiyu AI – Заморожена. 8 декабря 2024 года, когда один из фанатов спросил об объявлении о том, что Haiyi получит полную базу данных голосов ИИ в 2025 году, неофициальный новостной ресурс SynthV News ответил, что Chiyu AI звучит слишком похоже на YouMao, что заставило Quadimension уважать пожелания поставщика голоса и отложить базу данных голосов на неопределенный срок, с примечанием, что она «скорее всего» будет «перезаписана позднее».
  • Genbu AI – Отменён. 22 августа 2021 VirVox Project загрузил пресс-релиз относительно краудфандинга для голосовой базы данных ИИ. Организация отметила, что они пытались получить необходимые разрешения через третью сторону, но возникли разногласия с последней, которая запросила надлежащие согласия. Это привело к недоразумению, что VirVox Project получил необходимые разрешения, таким образом сделав объявления о краудфандинговом мероприятии. После объявления они узнали, что у них нет надлежащего согласия, что привело к тому, что они позже объявили, что краудфандинг будет отложен. Поскольку между VirVox Project и сторонней организацией продолжались обсуждения, было решено не проводить краудфандинг для голосовой базы данных ИИ GENBU.[47]
  • Chiyu Plus, Xingchen Plus, Haiyi Plus, Cangqiong Plus, Shian Plus и Muxin Plus - Отменены. Это были ИИ голосовые банки, созданные с помощью Standard банков.[48] В течение 2022 года Cangqiong Plus и Muxin Plus получили несколько демо-треков, демонстрирующих их возможности в качестве обученных по Standard войсбанков ИИ, включая функцию межъязыкового синтеза пения. Однако новости о разработке и будущих выпусках в целом для всех шести персонажей не были доступны. 29 сентября в ответ на вопрос фаната о том, будут ли выпущены версии Plus шести голосовых баз данных в ближайшее время, Quadimension написал, что это, вероятно, маловероятно из-за их непригодности для коммерческого использования.[49] 22 ноября в ответ на вопрос фаната Ddickky подтвердил, что серия голосовых баз данных Plus была создана с целью продемонстрировать эффекты обучения ИИ с помощью стандартных голосовых баз данных и не предназначалась для выпуска. Голосовые базы данных были отправлены акционерам в качестве демонстрации технологии, а не как полное обновление продукта. Поскольку эти голосовые базы данных должны были демонстрировать эффекты и технологию сплайсинга обучения ИИ, их нельзя было обозначить как Synthesizer V AI, поскольку это повлияло бы на качество бренда голосовых баз данных ИИ, поэтому их нужно было назвать Synthesizer V Plus.[50][51]
  • Шираками Мэйто (яп. 白神芽音) — приватный японский вокал, разработанная Dreamtonics Co., Ltd. для проекта виртуального певца En-gene, совместного проекта TMIK Co., Ltd. и agehasprings Party, войсбанком ИИ (получившей название TMIK-F1) для Synthesizer V Studio. Она дебютировала в марте 2024 года. Ее голос предоставлен виртуальным блогером Шираками Мэйто, виртуальным певцом, принадлежащим En-gene.

Примечания

  1. 1 2 新世代歌声合成ソフトウェアが登場!「Synthesizer Vシリーズ」 2020年7月30日発売|AHS(AH-Software). www.ah-soft.com. Дата обращения: 10 января 2021. Архивировано 27 ноября 2020 года.
  2. https://twitter.com/khuasw/status/1112006856283570177?s=20
  3. SoundCloud - Hear the world’s sounds
  4. https://twitter.com/khuasw/status/936463709203062784?s=20
  5. Synthesizer V voice - Regular vs AI - YouTube
  6. Cross-lingual Support for Synthesizer V AI | Dreamtonics株式会社
  7. https://x.com/dreamtonics_en/status/1871571539990388895
  8. https://x.com/dreamtonics_en/status/1877564518923940050
  9. https://x.com/dreamtonics_en/status/1889895598700306450
  10. https://x.com/ahsoft/status/1889872999995912549
  11. Synthesizer V Studio 2 Pro: Exclusive Preview - YouTube
  12. Discussed and demonstrated from 35:38 to 37:53 in the video.
  13. Dreamtonics (яп.). Dreamtonics. Дата обращения: 10 января 2021. Архивировано 2 января 2021 года.
  14. Q&A Livestream 1 - Synthesizer V SOLARIS project | Eclipsed Sounds - YouTube
  15. https://twitter.com/OfficialVolor/status/1392293299105370113
  16. https://twitter.com/OfficialVolor/status/1392293300447498240
  17. index - powered by h5ai v0.29.2 (https://larsjung.de/h5ai/). resource.dreamtonics.com. Дата обращения: 10 января 2021. Архивировано 12 января 2021 года.
  18. 1 2 VNN Interview with Kanru Hua for Synthesizer V! (англ.). VNN (26 января 2019). Дата обращения: 10 января 2021. Архивировано 20 января 2021 года.
  19. Visting IMSTA FESTA Toronto Special Report! | Vocal Synth Retailers Resource Blog
  20. https://x.com/NatalieNicole/status/1788409254170484859 - Natalie VP's reveal
  21. https://x.com/NatalieNicole/status/1789008514234683427
  22. https://x.com/dreamtonics_en/status/1889896660207280248
  23. https://x.com/dreamtonics_en/status/1889896657917190330
  24. 캐릭터 플래닛 – 보컬로이드 전문 업체 주식회사 에스티미디어가 직영하는 온라인 스토어입니다
  25. Before The Quiet Comes - Synthesizer V HXVOC Showcase - YouTube
  26. About crowdfunding for the production of "Genbu AI Version"|VirVoxプロジェクト(旧ページ)
  27. https://t.bilibili.com/609647028303295976
  28. https://x.com/Imsupposed2/status/1586069151314870277
  29. https://www.bilibili.com/read/cv19899475
  30. https://web.archive.org/web/20250228064817/https://cdn.discordapp.com/attachments/986786656084455434/1044406907152113664/image.png?ex=67c252ba&is=67c1013a&hm=5261a8c41aa88e0ec9db0dd5850a5b604dc9ad1125898bacf569d4386144d441&

Ссылки

No tags for this post.