Google के नोटबुकएलएम को टक्कर देने के लिए मेटा नोटबुकलामा एआई पॉडकास्ट जेनरेटर को ‘ओपन सोर्स टूल’ के रूप में जारी किया गया

मेटा ने रविवार को एक नया ओपन-सोर्स आर्टिफिशियल इंटेलिजेंस (एआई) टूल जारी किया जो Google NotebookLM को टक्कर देगा। नोटबुकलामा नाम का यह टूल एक एआई-संचालित पॉडकास्ट जनरेटर है, जहां उपयोगकर्ता एक पीडीएफ फाइल अपलोड कर सकते हैं और टूल इसे दो एआई अक्षरों के साथ एक ऑडियो पॉडकास्ट में बदल देगा। पूरी प्रक्रिया को पूरा करने के लिए टूल तीन अलग-अलग लामा 3.1 एआई मॉडल का उपयोग करता है। Google के टूल की तरह, NotebookLlama का पॉडकास्ट भी दो AI होस्ट के बीच फ्री-फ्लोइंग तरीके से आगे-पीछे की बातचीत का अनुसरण करता है।

मेटा नोटबुकलामा एआई टूल टेक्स्ट के ब्लॉक से ऑडियो पॉडकास्ट उत्पन्न करने के लिए तीन बड़े भाषा मॉडल का उपयोग करता है। वर्तमान में, टूल केवल पीडीएफ फाइलों को इनपुट के रूप में स्वीकार करता है, इसलिए उपयोगकर्ताओं को उनके पास जो भी टेक्स्ट प्रारूप है उसे पीडीएफ में परिवर्तित करना होगा।

मेटा नोटबुकलामा मेटा नोटबुकलामा

मेटा नोटबुकलामा वर्कफ़्लो
फोटो साभार: मेटा

NotebookLlama सबसे पहले पीडीएफ फाइल को प्री-प्रोसेस करने और इसे ‘.txt’ फाइल में सेव करने के लिए Llama 3.2 1B इंस्ट्रक्शन मॉडल का उपयोग करता है। फिर लामा 3.1 70बी इंस्ट्रक्शन मॉडल का उपयोग स्रोत डेटासेट का उपयोग करके पॉडकास्ट ट्रांसक्रिप्ट लिखने के लिए किया जाता है। फिर प्रतिलेखन को एक पुनः लेखक का उपयोग करके नाटकीय रूप दिया जाता है जो लामा 3.1 8बी निर्देश मॉडल का उपयोग करता है। अंत में, टेक्स्ट-टू-स्पीच वर्कफ़्लो में ट्रांसक्रिप्शन जोड़ने के लिए एक कस्टम टूल का उपयोग किया जाता है। इसके लिए मेटा Parler TTS टूल का उपयोग कर रहा है। इच्छुक व्यक्ति GitHub लिस्टिंग से पॉडकास्ट उत्पन्न करने के लिए आवश्यक सभी मॉडलों तक पहुंच सकते हैं यहाँ.

हालाँकि, ऊपर उल्लिखित एआई मॉडल केवल डेवलपर्स की सिफारिशें हैं। उपयोगकर्ता प्रत्येक चरण के लिए छोटे मॉडल का उपयोग करना पसंद कर सकते हैं, हालाँकि, परिणाम भिन्न हो सकते हैं। मेटा ने इस बात पर प्रकाश डाला कि अनुशंसित सेटअप में AI सिस्टम को चलाने के लिए, उपयोगकर्ताओं को लगभग 140GB की कुल मेमोरी वाले GPU की आवश्यकता होगी।

एक एक्स (पहले ट्विटर के नाम से जाना जाता था) उपयोगकर्ता की तैनाती उत्पन्न पॉडकास्ट का एक नमूना। इसके आधार पर, ऐसा प्रतीत होता है कि ऑडियो गुणवत्ता Google NotebookLM जितनी अच्छी नहीं है, और यह तीखी और रोबोटिक लगती है। इसके अलावा, ऐसे उदाहरण भी हैं जहां ऑडियो के कुछ हिस्से छूट जाते हैं और एआई होस्ट एक-दूसरे के ऊपर बोलने लगते हैं।

मेटा कुछ मुद्दों को स्वीकार करता है और एआई उत्पाद के अगले संस्करण में उन्हें सुधारने की योजना बना रहा है। कंपनी ने इस बात पर प्रकाश डाला, “टीटीएस मॉडल इस बात की सीमा है कि यह कितना स्वाभाविक लगेगा। इसे संभवतः बेहतर पाइपलाइन और किसी अधिक जानकार की मदद से बेहतर बनाया जा सकता है।”

तकनीकी दिग्गज स्क्रिप्ट लिखने के लिए दो अलग-अलग एलएलएम का उपयोग करने की भी योजना बना रहे हैं, जहां प्रत्येक मॉडल पॉडकास्ट ध्वनि को अधिक संवादी बनाने के लिए दूसरे पर बहस करेगा। यह डेवलपर्स की भविष्य की पाइपलाइन का भी हिस्सा है। इसके अतिरिक्त, कंपनी ट्रांसक्रिप्ट लिखने के साथ-साथ अधिक इनपुट और आउटपुट प्रारूपों के लिए समर्थन बढ़ाने के लिए लामा 405बी एआई मॉडल का भी परीक्षण कर रही है।

नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए गैजेट्स 360 को फ़ॉलो करें एक्स, फेसबुक, WhatsApp, धागे और गूगल समाचार. गैजेट और तकनीक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें यूट्यूब चैनल. यदि आप शीर्ष प्रभावशाली व्यक्तियों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस को फ़ॉलो करें वह360 कौन है? पर Instagram और यूट्यूब.

iPhone SE 4 6.06-इंच LTPS OLED स्क्रीन, 3,279mAh बैटरी और Apple के इन-हाउस मॉडेम के साथ आने की उम्मीद है


इंडोनेशिया में iPhone 16 सीरीज की बिक्री निवेश आवश्यकताओं के पूरा न होने के कारण अवरुद्ध है

Leave a Comment

Your email address will not be published. Required fields are marked *