Youka предлагает различные методы согласования текста с музыкой в Ваших караоке-треках, известные как модели синхронизации. Существует два основных типа: транскрипция и выравнивание.
- Модели транскрипции слушают песню и пытаются записать текст, как это сделал бы человек, используя технологию, похожую на распознавание голоса. Однако слова, которые они записывают, могут быть не совсем точными.
- Модели согласования требуют, чтобы Вы предоставили текст песни. Затем они пытаются сопоставить эти слова с песней. Если предоставленный Вами текст не совсем соответствует песне (например, если отсутствует припев), то время исполнения может быть немного нарушено.
Вот модели, которые использует Youka:
- AudioShakeAI (транскрипция): Это лучший выбор, который работает, сначала записывая текст песни, а затем сопоставляя его с музыкой. Она доступна только в том случае, если Вы платный пользователь или используете пробную версию, и ее работа может занять до 10 минут.
- AudioShakeAI (Выравнивание): Далее идет согласование предоставленного Вами текста с музыкой. Если в тексте есть ошибки, то синхронизация может быть не идеальной. Это также занимает до 5 минут.
- Wav2Vec2 (выравнивание): Это третий вариант, который работает так же, как AudioShakeAI, но поддерживает почти все языки. Он работает быстрее, обычно завершая работу за 30 секунд.
- Шепот (транскрипция): Это четвертый вариант, который также слушает музыку, чтобы записать текст перед синхронизацией. Слова могут быть не совсем точными, но время исполнения должно быть приличным, и на это уйдет до 2 минут.