मेटा ने रविवार को एक नया ओपन-सोर्स आर्टिफिशियल इंटेलिजेंस (एआई) टूल जारी किया जो Google NotebookLM को टक्कर देगा। नोटबुकलामा नाम का यह टूल एक एआई-संचालित पॉडकास्ट जनरेटर है, जहां उपयोगकर्ता एक पीडीएफ फाइल अपलोड कर सकते हैं और टूल इसे दो एआई अक्षरों के साथ एक ऑडियो पॉडकास्ट में बदल देगा। पूरी प्रक्रिया को पूरा करने के लिए टूल तीन अलग-अलग लामा 3.1 एआई मॉडल का उपयोग करता है। Google के टूल की तरह, NotebookLlama का पॉडकास्ट भी दो AI होस्ट के बीच फ्री-फ्लोइंग तरीके से आगे-पीछे की बातचीत का अनुसरण करता है।
मेटा नोटबुकलामा एआई टूल टेक्स्ट के ब्लॉक से ऑडियो पॉडकास्ट उत्पन्न करने के लिए तीन बड़े भाषा मॉडल का उपयोग करता है। वर्तमान में, टूल केवल पीडीएफ फाइलों को इनपुट के रूप में स्वीकार करता है, इसलिए उपयोगकर्ताओं को उनके पास जो भी टेक्स्ट प्रारूप है उसे पीडीएफ में परिवर्तित करना होगा।
NotebookLlama सबसे पहले पीडीएफ फाइल को प्री-प्रोसेस करने और इसे ‘.txt’ फाइल में सेव करने के लिए Llama 3.2 1B इंस्ट्रक्शन मॉडल का उपयोग करता है। फिर लामा 3.1 70बी इंस्ट्रक्शन मॉडल का उपयोग स्रोत डेटासेट का उपयोग करके पॉडकास्ट ट्रांसक्रिप्ट लिखने के लिए किया जाता है। फिर प्रतिलेखन को एक पुनः लेखक का उपयोग करके नाटकीय रूप दिया जाता है जो लामा 3.1 8बी निर्देश मॉडल का उपयोग करता है। अंत में, टेक्स्ट-टू-स्पीच वर्कफ़्लो में ट्रांसक्रिप्शन जोड़ने के लिए एक कस्टम टूल का उपयोग किया जाता है। इसके लिए मेटा Parler TTS टूल का उपयोग कर रहा है। इच्छुक व्यक्ति GitHub लिस्टिंग से पॉडकास्ट उत्पन्न करने के लिए आवश्यक सभी मॉडलों तक पहुंच सकते हैं यहाँ.
हालाँकि, ऊपर उल्लिखित एआई मॉडल केवल डेवलपर्स की सिफारिशें हैं। उपयोगकर्ता प्रत्येक चरण के लिए छोटे मॉडल का उपयोग करना पसंद कर सकते हैं, हालाँकि, परिणाम भिन्न हो सकते हैं। मेटा ने इस बात पर प्रकाश डाला कि अनुशंसित सेटअप में AI सिस्टम को चलाने के लिए, उपयोगकर्ताओं को लगभग 140GB की कुल मेमोरी वाले GPU की आवश्यकता होगी।
एक एक्स (पहले ट्विटर के नाम से जाना जाता था) उपयोगकर्ता की तैनाती उत्पन्न पॉडकास्ट का एक नमूना। इसके आधार पर, ऐसा प्रतीत होता है कि ऑडियो गुणवत्ता Google NotebookLM जितनी अच्छी नहीं है, और यह तीखी और रोबोटिक लगती है। इसके अलावा, ऐसे उदाहरण भी हैं जहां ऑडियो के कुछ हिस्से छूट जाते हैं और एआई होस्ट एक-दूसरे के ऊपर बोलने लगते हैं।
मेटा कुछ मुद्दों को स्वीकार करता है और एआई उत्पाद के अगले संस्करण में उन्हें सुधारने की योजना बना रहा है। कंपनी ने इस बात पर प्रकाश डाला, “टीटीएस मॉडल इस बात की सीमा है कि यह कितना स्वाभाविक लगेगा। इसे संभवतः बेहतर पाइपलाइन और किसी अधिक जानकार की मदद से बेहतर बनाया जा सकता है।”
तकनीकी दिग्गज स्क्रिप्ट लिखने के लिए दो अलग-अलग एलएलएम का उपयोग करने की भी योजना बना रहे हैं, जहां प्रत्येक मॉडल पॉडकास्ट ध्वनि को अधिक संवादी बनाने के लिए दूसरे पर बहस करेगा। यह डेवलपर्स की भविष्य की पाइपलाइन का भी हिस्सा है। इसके अतिरिक्त, कंपनी ट्रांसक्रिप्ट लिखने के साथ-साथ अधिक इनपुट और आउटपुट प्रारूपों के लिए समर्थन बढ़ाने के लिए लामा 405बी एआई मॉडल का भी परीक्षण कर रही है।
नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए गैजेट्स 360 को फ़ॉलो करें एक्स, फेसबुक, WhatsApp, धागे और गूगल समाचार. गैजेट और तकनीक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें यूट्यूब चैनल. यदि आप शीर्ष प्रभावशाली व्यक्तियों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस को फ़ॉलो करें वह360 कौन है? पर Instagram और यूट्यूब.
iPhone SE 4 6.06-इंच LTPS OLED स्क्रीन, 3,279mAh बैटरी और Apple के इन-हाउस मॉडेम के साथ आने की उम्मीद है
इंडोनेशिया में iPhone 16 सीरीज की बिक्री निवेश आवश्यकताओं के पूरा न होने के कारण अवरुद्ध है
Shivani Kumari is the founder of Niollo.in, where she shares her expertise on crypto and home appliances. With a passion for simplifying complex topics, Shivani creates engaging and informative blog posts to help readers make better decisions in the digital and home spaces.