विभाजित मॉडल

यूका में, आप किसी गाने में स्वरों को वाद्यों से अलग करने के लिए “स्प्लिट मॉडल” सुविधा का उपयोग कर सकते हैं। आपके पास दो विकल्प हैं:

  1. डेमक्स डेमक्स (संगीत स्रोतों के लिए डीप एक्सट्रैक्टर) संगीत स्रोत पृथक्करण के लिए एक अत्याधुनिक डीप लर्निंग मॉडल है। यह समय-डोमेन में काम करता है, ऑडियो के अस्थायी विवरणों को संरक्षित करता है, और एक कन्वोल्यूशनल न्यूरल नेटवर्क (CNN) आर्किटेक्चर का उपयोग करता है। डेमक्स को वोकल्स, ड्रम, बास और अन्य उपकरणों के उच्च-गुणवत्ता वाले पृथक्करण के लिए जाना जाता है, जो इसे कराओके निर्माण और संगीत उत्पादन जैसे कार्यों के लिए एक शीर्ष विकल्प बनाता है। यह कई संस्करणों के माध्यम से विकसित हुआ है, प्रत्येक पिछले संस्करण में सुधार करता है, और सिग्नल-टू-डिस्टॉर्शन रेशियो (एसडीआर) बेंचमार्क ( गिटहब ) ( क्वाड्राफोनिकक्वाड ) में अपने मजबूत प्रदर्शन के लिए पहचाना जाता है।
  2. MDX -23C मॉडल को एडवांस्ड म्यूजिक डिमिक्सिंग कार्यों के लिए डिज़ाइन किया गया है, जो विशेष रूप से संगीत को चार स्टेम में विभाजित करने के लिए लक्षित है: बास, ड्रम, वोकल्स और अन्य इंस्ट्रूमेंट्स। यह मॉडल Demucs4 और MDX न्यूरल नेट आर्किटेक्चर के मिश्रण पर आधारित है और अल्टीमेट वोकल रिमूवर प्रोजेक्ट से कुछ वज़न को शामिल करता है। MDX-23C उच्च-गुणवत्ता वाला पृथक्करण प्रदान करता है और शक्तिशाली GPU सेटअप के साथ उपयोग किए जाने पर विशेष रूप से प्रभावी होता है, जो इसे सटीक और पेशेवर-ग्रेड ऑडियो पृथक्करण की तलाश करने वाले उपयोगकर्ताओं के लिए एक मजबूत विकल्प बनाता है​ ( GitHub )​ ( QuadraphonicQuad )।
  3. रिफॉर्मर रिफॉर्मर संगीत डिमिक्सिंग के क्षेत्र में अपेक्षाकृत नया प्रवेशक है, जो संगीत ट्रैक में स्टेम को अलग करने के अपने अभिनव दृष्टिकोण के लिए जाना जाता है। जबकि रिफॉर्मर के बारे में विस्तृत जानकारी कम व्यापक है, यह पारंपरिक सिग्नल प्रोसेसिंग तकनीकों को आधुनिक डीप लर्निंग विधियों के साथ जोड़कर स्वच्छ और सटीक पृथक्करण प्राप्त करने के लिए प्रतिष्ठित है। इस मॉडल का उद्देश्य गुणवत्ता और प्रसंस्करण गति को संतुलित करना है, जिससे यह पेशेवर और शौकिया दोनों उपयोगकर्ताओं के लिए उपयुक्त है।
  4. एमडीएक्स-नेट (बैकिंग वोकल्स के साथ) MDX-Net एक दो-स्ट्रीम न्यूरल नेटवर्क है जिसे विशेष रूप से संगीत डिमिक्सिंग के लिए विकसित किया गया है, जिसमें टाइम-फ़्रीक्वेंसी शाखा और टाइम-डोमेन शाखा दोनों शामिल हैं। यह आर्किटेक्चर मॉडल को ऑडियो के विभिन्न पहलुओं का विश्लेषण करके स्टेम को अलग करने की अनुमति देता है, दोनों धाराओं से आउटपुट को मिलाकर अत्यधिक सटीक पृथक्करण उत्पन्न करता है। MDX-Net ने अंतर्राष्ट्रीय संगीत डिमिक्सिंग चुनौतियों में शीर्ष स्थान हासिल करके अपनी प्रभावशीलता साबित की है, जिससे यह उन उपयोगकर्ताओं के लिए एक विश्वसनीय विकल्प बन गया है जिन्हें अपने ऑडियो प्रोसेसिंग में उच्च परिशुद्धता की आवश्यकता है​ ( GitHub )।
What are your feelings
Updated on अगस्त 28, 2024