Openai ने कथित तौर पर दावा किया है कि दीपसेक ने R1 मॉडल के निर्माण के लिए अपने आर्टिफिशियल इंटेलिजेंस (AI) मॉडल को डिस्टिल्ड किया हो सकता है। रिपोर्ट के अनुसार, सैन फ्रांसिस्को स्थित एआई फर्म ने कहा कि इसके पास सबूत है कि कुछ उपयोगकर्ता एक प्रतियोगी के लिए अपने एआई मॉडल के आउटपुट का उपयोग कर रहे थे, जो कि डीपसेक होने का संदेह है। विशेष रूप से, चीनी कंपनी ने पिछले हफ्ते ओपन-सोर्स डीपसेक-आर 1 एआई मॉडल जारी किया और इसे गिथब और गले लगाने वाले चेहरे पर होस्ट किया। तर्क-केंद्रित मॉडल ने कई बेंचमार्क में CHATGPT-MAKER के O1 AI मॉडल की क्षमताओं को पार कर लिया।
ओपनई का कहना है कि इसमें फाउलप्ले का सबूत है
एक फाइनेंशियल टाइम्स के अनुसार प्रतिवेदनOpenai ने दावा किया कि उसके मालिकाना AI मॉडल का उपयोग दीपसेक के मॉडल को प्रशिक्षित करने के लिए किया गया था। कंपनी ने प्रकाशन को बताया कि उसने OpenAI एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (API) का उपयोग करके कई खातों से आसवन का प्रमाण देखा था। एआई फर्म और उसके क्लाउड पार्टनर माइक्रोसॉफ्ट ने इस मुद्दे की जांच की और उनकी पहुंच को अवरुद्ध कर दिया।
फाइनेंशियल टाइम्स को एक बयान में, ओपनई ने कहा, “हम जानते हैं [China]-आधारित कंपनियां -और अन्य -लगातार अमेरिकी एआई कंपनियों के मॉडल को दूर करने की कोशिश कर रहे हैं। ” चैट-मेकर ने यह भी कहा कि यह अमेरिकी सरकार के साथ मिलकर काम कर रहा है ताकि प्रतियोगियों और विरोधियों से अपने फ्रंटियर मॉडल की रक्षा की जा सके।
विशेष रूप से, एआई मॉडल आसवन एक ऐसी तकनीक है जिसका उपयोग बड़े मॉडल से ज्ञान को एक छोटे और अधिक कुशल मॉडल में स्थानांतरित करने के लिए किया जाता है। यहां लक्ष्य कम्प्यूटेशनल आवश्यकताओं को कम करते हुए छोटे मॉडल को बराबर या बड़े मॉडल के आगे लाना है। विशेष रूप से, Openai के GPT-4 में लगभग 1.8 ट्रिलियन पैरामीटर हैं, जबकि DeepSeek-R1 में 1.5 बिलियन पैरामीटर हैं, जो विवरण को फिट करेगा।
ज्ञान हस्तांतरण आमतौर पर छोटे मॉडल को प्रशिक्षित करने के लिए बड़े मॉडल से प्रासंगिक डेटासेट का उपयोग करके होता है, जब कोई कंपनी अपने मॉडल के इन-हाउस के अधिक कुशल संस्करण बना रही है। उदाहरण के लिए, मेटा ने कई कोडिंग-केंद्रित लामा मॉडल बनाने के लिए लामा 3 एआई मॉडल का उपयोग किया।
हालांकि, यह संभव नहीं है जब एक प्रतियोगी, जिसमें एक मालिकाना मॉडल के डेटासेट तक पहुंच नहीं है, एक मॉडल को अलग करना चाहता है। यदि Openai के आरोप सही हैं, तो यह बड़ी संख्या में आउटपुट उत्पन्न करने के लिए अपने API में शीघ्र इंजेक्शन जोड़कर किया जा सकता था। यह प्राकृतिक भाषा डेटा तब कोड में परिवर्तित हो जाता है और एक आधार मॉडल में खिलाया जाता है।
विशेष रूप से, Openai ने सार्वजनिक रूप से इस बारे में एक बयान जारी नहीं किया है। हाल ही में, कंपनी के सीईओ सैम अल्टमैन ने इस तरह के एक उन्नत एआई मॉडल बनाने और एआई अंतरिक्ष में प्रतिस्पर्धा बढ़ाने के लिए दीपसेक की प्रशंसा की।
Shivani Kumari is the founder of Niollo.in, where she shares her expertise on crypto and home appliances. With a passion for simplifying complex topics, Shivani creates engaging and informative blog posts to help readers make better decisions in the digital and home spaces.