Раздельная модель

В Youka Вы можете использовать функцию “Split model”, чтобы отделить вокал от инструментальных партий в песне. У Вас есть две опции:

  1. Demucs Demucs (Deep Extractor for Music Sources) – это современная модель глубокого обучения для разделения музыкальных источников. Она работает во временной области, сохраняя временные детали аудио, и использует архитектуру конволюционной нейронной сети (CNN). Demucs известен своим высококачественным разделением вокала, ударных, баса и других инструментов, что делает его лучшим выбором для таких задач, как создание караоке и производство музыки. Он прошел через множество версий, каждая из которых улучшала предыдущую, и получил признание за высокие показатели в бенчмарках соотношения сигнал/искажение (SDR)(GitHub)(QuadraphonicQuad).
  2. MDX-23C Модель MDX-23C разработана для продвинутых задач демиксирования музыки, в частности, для разделения музыки на четыре стебля: бас, барабаны, вокал и другие инструменты. Эта модель основана на смешении архитектур нейронных сетей Demucs4 и MDX и включает в себя определенные веса из проекта Ultimate Vocal Remover. MDX-23C обеспечивает высококачественное разделение и особенно эффективен при использовании мощного GPU, что делает его отличным выбором для пользователей, которым требуется точное разделение звука профессионального уровня(GitHub)(QuadraphonicQuad).
  3. ReFormer ReFormer – относительно новый участник в области музыкального демиксинга, известный своим инновационным подходом к разделению стеблей в музыкальных треках. Хотя подробная информация о ReFormer не так широко распространена, считается, что он сочетает традиционные методы обработки сигнала с современными методами глубокого обучения для достижения чистого и точного разделения. Эта модель нацелена на баланс между качеством и скоростью обработки, что делает ее подходящей как для профессионалов, так и для любителей.
  4. MDX-Net (с бэк-вокалом) MDX-Net – это двухпотоковая нейронная сеть, специально разработанная для демиксирования музыки. В ней есть ветвь временных частот и ветвь временной области. Такая архитектура позволяет модели разделять стебли, анализируя различные аспекты аудио, объединяя выходы обоих потоков для создания высокоточных разделений. MDX-Net доказал свою эффективность, заняв первые места в международных соревнованиях по демиксированию музыки, что делает его надежным вариантом для пользователей, которым нужна высокая точность обработки аудио(GitHub).
Оцените документ
Обновлено 30 сентября, 2024