في Youka، يمكنك استخدام ميزة “نموذج التقسيم” لفصل الغناء عن الآلات الموسيقية في الأغنية. لديك خياران:
- Demucs Demucs (المستخرج العميق لمصادر الموسيقى) هو نموذج تعلم عميق متطور لفصل مصادر الموسيقى. وهو يعمل في المجال الزمني، ويحافظ على التفاصيل الزمنية للصوت، ويستخدم بنية الشبكة العصبية التلافيفية (CNN). يشتهر Demucs بفصله عالي الجودة للغناء والطبول والجهير والآلات الموسيقية الأخرى، مما يجعله الخيار الأفضل لمهام مثل إنشاء الكاريوكي وإنتاج الموسيقى. وقد تطورت من خلال إصدارات متعددة، كل إصدار منها يتحسن عن الإصدار السابق، وهي معروفة بأدائها القوي في معايير نسبة الإشارة إلى التشويه (SDR)(GitHub)(QuadraphonicQuad).
- MDX-23C صُمم نموذج MDX-23C لمهام إزالة المزج الموسيقي المتقدمة، ويستهدف تحديدًا فصل الموسيقى إلى أربعة سيقان: الباس، والطبول، والغناء، والآلات الأخرى. يعتمد هذا النموذج على مزيج من بنيتي الشبكة العصبية Demucs4 و MDX ويتضمن أوزانًا معينة من مشروع المزيل الصوتي النهائي. يوفر MDX-23C فصلًا عالي الجودة ويكون فعالًا بشكل خاص عند استخدامه مع إعداد قوي لوحدة معالجة الرسوميات، مما يجعله خيارًا قويًا للمستخدمين الذين يبحثون عن فصل صوتي دقيق واحترافي(GitHub)(QuadraphonicQuad).
- ReFormer ReFormer هو وافد جديد نسبيًا في مجال إزالة المزج الموسيقي، وهو معروف بنهجه المبتكر لفصل السيقان في المقطوعات الموسيقية. على الرغم من أن المعلومات التفصيلية حول ReFormer أقل انتشارًا، إلا أنه يشتهر بدمج تقنيات معالجة الإشارات التقليدية مع أساليب التعلم العميق الحديثة لتحقيق فصل نظيف ودقيق. يهدف هذا النموذج إلى تحقيق التوازن بين الجودة وسرعة المعالجة، مما يجعله مناسبًا للمستخدمين المحترفين والهواة على حد سواء.
- MDX-Net (مع غناء مساند) MDX-Net عبارة عن شبكة عصبية ثنائية الدفق تم تطويرها خصيصًا لإزالة خلط الموسيقى، وتضم فرعًا للتردد الزمني وفرعًا للمجال الزمني. وتسمح هذه البنية للنموذج بفصل السيقان من خلال تحليل جوانب مختلفة من الصوت، والجمع بين المخرجات من كلا التيارين لتوليد عمليات فصل عالية الدقة. وقد أثبتت MDX-Net فعاليتها من خلال حصولها على المراكز الأولى في تحديات إزالة خلط الموسيقى الدولية، مما يجعلها خيارًا موثوقًا للمستخدمين الذين يحتاجون إلى دقة عالية في معالجة الصوت(GitHub).