एआई-फोकस्ड टेक्स्ट-टू-स्पीच स्पेस में एक लीडर ElevenLabs ने एक नए एआई टूल का ऐलान किया है जिससे यूनिक ऑडियोबुक्स बड़ी आसानी से बनाया जा सकता है।

इलेवनलैब्स ने ‘प्रोजेक्ट्स’ नाम का प्लेटफॉर्म लॉन्च किया है जो लॉन्ग-फॉर्म स्पोकन कंटेंट, जैसे ऑडियोबुक्स, बनाने के प्रोडक्शन वर्कफ़्लो को सरल बनाता है। यह कंपनी के एआई-ड्रिवन वॉइस टेक्नोलॉजी प्लेटफॉर्म पर आधारित है। इस टेक्नोलॉजी के जरिए किसी भी टेक्स्ट को सिंथेटिक वॉइस, क्लोन वॉइस या “पूरी तरह से नई आर्टिफिशल आवाज़ों” में कन्वर्ट किया जा सकता है, जो जेंडर, उम्र, उच्चारण और अन्य कुछ पैरामीटर्स के आधार पर एडजस्ट कर सकते हैं।
इलेवनलैब्स के अनुसार, उनके प्रोप्राइटरी एआई मॉडल “सबसे अलग-अलग और संदर्भानुसार” आवाज़ बना सकते हैं, और ये आवाज़ ऑडियोबुक्स के लिए परफेक्ट होते हैं। रियलिज़म पर आधारित एल्गोरिदम्स और कम से कम 1 सेकंड की लैटेंसी के कारण, कंटेंट “एक असली इंसान से अलग करने के करीब” हो जाती है। यह सर्विस जुलाई में लॉन्च होने वाली है, लेकिन अभी अर्ली एक्सेस वर्ज़न भी उपलब्ध है, इसलिए आप ग्रेट अमेरिकी ऑडियो-नॉवेल बना सकते हैं।
इलेवनलैब्स ने एक सर्विस भी एनाउंस की है जो स्पोकन वर्ड ऑडियो को ऐनलाइज़ करती है और यह निर्धारित करती है कि क्या उसमें कोई एआई का उपयोग किया गया है या नहीं। इस सर्विस के जरिए कोई भी ऑडियो सैंपल इंस्पेक्शन के लिए अपलोड कर सकता है। कंपनी के अनुसार, यह एक कदम है एआई-जेनरेटेड स्पीच के संबंध में ट्रांसपेरेंसी की तरफ है।
इलेवनलैब्स के पास कुछ और टेक्स्ट-टू-स्पीच टूल भी हैं, जैसे स्पीच सिंथेसिस और वॉइसलैब। वॉइसलैब के जरिए आप किसी मौजूदा आवाज़ का डिजिटल वर्ज़न बना सकते हैं। हाल ही में लॉन्च की गई इलेवन मल्टीलिंगअल सर्विस के जरिए ये सर्विसेस अंग्रेजी और प्रमुख यूरोपीय भाषाओं में उपलब्ध हैं।
Source/Via: LifeWire