AI

विशेषज्ञों ने ‘मानवता की अंतिम परीक्षा’ में कठिन एआई प्रश्नों के लिए वैश्विक आह्वान शुरू किया | मिंट – news247online

Published

3 months ago

September 19, 2024

प्रौद्योगिकी विशेषज्ञों की एक टीम ने सोमवार को एक वैश्विक आह्वान जारी किया, जिसमें कृत्रिम बुद्धिमत्ता प्रणालियों से पूछे जाने वाले सबसे कठिन प्रश्नों की मांग की गई, जो कि लोकप्रिय बेंचमार्क परीक्षणों को बच्चों के खेल की तरह संभालते हैं।

“मानवता की अंतिम परीक्षा” नामक इस परियोजना का उद्देश्य यह निर्धारित करना है कि विशेषज्ञ स्तर का AI कब आ गया है। आयोजकों, सेंटर फॉर AI सेफ्टी (CAIS) नामक एक गैर-लाभकारी संस्था और स्टार्टअप स्केल AI के अनुसार, इसका उद्देश्य भविष्य के वर्षों में क्षमताओं के बढ़ने के बावजूद प्रासंगिक बने रहना है।

सीएआईएस के कार्यकारी निदेशक और एलन मस्क के एक्सएआई स्टार्टअप के सलाहकार डैन हेंड्रिक्स ने कहा कि यह कॉल चैटजीपीटी के निर्माता द्वारा ओपनएआई ओ1 नामक एक नए मॉडल का पूर्वावलोकन करने के कुछ दिनों बाद आया है, जिसने “सबसे लोकप्रिय तर्क बेंचमार्क को नष्ट कर दिया”।

हेंड्रिक्स ने 2021 के दो पेपरों का सह-लेखन किया, जिसमें एआई सिस्टम के परीक्षण प्रस्तावित किए गए थे, जिनका अब व्यापक रूप से उपयोग किया जाता है, एक में अमेरिकी इतिहास जैसे विषयों के स्नातक स्तर के ज्ञान पर सवाल पूछे गए, जबकि दूसरे में प्रतिस्पर्धा-स्तर के गणित के माध्यम से मॉडल की तर्क करने की क्षमता की जांच की गई। स्नातक-शैली के परीक्षण को ऑनलाइन एआई हब हगिंग फेस से किसी भी ऐसे डेटासेट की तुलना में अधिक डाउनलोड किया गया है।

उन पेपरों के समय, एआई परीक्षा में प्रश्नों के लगभग बेतरतीब उत्तर दे रहा था। हेंड्रिक्स ने रॉयटर्स को बताया, “अब वे कुचले जा चुके हैं।”

यह भी पढ़ें केवल 30 मिनट की पैदल दूरी एक बड़ा अंतर ला सकती है: 6 तरीके जो आपके जीवन को बेहतर बनाएंगे - news247online

एक उदाहरण के रूप में, एक प्रमुख क्षमता लीडरबोर्ड के अनुसार, एआई लैब एंथ्रोपिक के क्लाउड मॉडल ने 2023 में स्नातक स्तर की परीक्षा में लगभग 77% स्कोर किया है, जो एक वर्ष बाद लगभग 89% हो जाएगा।

परिणामस्वरूप इन सामान्य मानदंडों का अर्थ कम हो गया है।

स्टैनफोर्ड यूनिवर्सिटी की अप्रैल की एआई इंडेक्स रिपोर्ट के अनुसार, योजना निर्माण और विज़ुअल पैटर्न-पहचान पहेलियों से जुड़े कम इस्तेमाल किए जाने वाले परीक्षणों में एआई का स्कोर खराब रहा है। उदाहरण के लिए, एआरसी आयोजकों ने शुक्रवार को कहा कि ओपनएआई ओ1 ने पैटर्न-पहचान एआरसी-एजीआई परीक्षण के एक संस्करण पर लगभग 21% स्कोर किया।

कुछ एआई शोधकर्ताओं का तर्क है कि इस तरह के परिणाम योजना और अमूर्त तर्क को बुद्धिमत्ता के बेहतर मापदंड के रूप में दिखाते हैं, हालांकि हेंड्रिक्स ने कहा कि एआरसी का दृश्य पहलू इसे भाषा मॉडल का आकलन करने के लिए कम उपयुक्त बनाता है। उन्होंने कहा कि “मानवता की अंतिम परीक्षा” के लिए अमूर्त तर्क की आवश्यकता होगी।

उद्योग पर्यवेक्षकों ने कहा है कि सामान्य बेंचमार्क से प्राप्त उत्तर भी एआई सिस्टम को प्रशिक्षित करने के लिए उपयोग किए जाने वाले डेटा में समाप्त हो सकते हैं। हेंड्रिक्स ने कहा कि “ह्यूमैनिटीज लास्ट एग्जाम” के कुछ प्रश्न निजी रहेंगे ताकि यह सुनिश्चित किया जा सके कि एआई सिस्टम के उत्तर याद करके नहीं दिए गए हैं।

परीक्षा में कम से कम 1,000 क्राउड-सोर्स्ड प्रश्न शामिल होंगे, जिनका उत्तर देना गैर-विशेषज्ञों के लिए कठिन होगा। इन प्रश्नों की समीक्षा की जाएगी, जिसमें विजयी प्रविष्टियों को सह-लेखक का दर्जा दिया जाएगा और स्केल एआई द्वारा प्रायोजित 5,000 डॉलर तक के पुरस्कार दिए जाएंगे।

यह भी पढ़ें नींबू पानी से लेकर एलोवेरा जूस तक: आपके पाचन में सुधार के लिए 6 स्वस्थ सुबह के पेय - news247online

स्केल के सीईओ एलेक्जेंडर वांग ने कहा, “हमें एआई की तीव्र प्रगति को मापने के लिए विशेषज्ञ स्तर के मॉडलों के लिए कठिन परीक्षणों की सख्त जरूरत है।”

एक प्रतिबंध: आयोजक चाहते हैं कि हथियारों के बारे में कोई प्रश्न न पूछा जाए, क्योंकि कुछ लोगों का कहना है कि हथियारों का अध्ययन करना ए.आई. के लिए बहुत खतरनाक होगा।

(सैन फ्रांसिस्को में जेफरी डास्टिन और न्यूयॉर्क में केटी पॉल द्वारा रिपोर्टिंग; क्रिस्टीना फिन्चर द्वारा संपादन)

सभी को पकड़ो व्यापार समाचार, बाज़ार समाचार, आज की ताजा खबर घटनाएँ और ताजा खबर लाइव मिंट पर अपडेट। डाउनलोड करें मिंट न्यूज़ ऐप दैनिक बाजार अपडेट प्राप्त करने के लिए.

अधिककम

Up Next

चैटजीपीटी को अपने यूजर पर ‘थोड़ा क्रश’ है; एआई बॉट बिना किसी संकेत के बातचीत शुरू करता है, ‘क्या आप अच्छी तरह से बस गए?’ | मिंट – news247online

Don't Miss

AI के भविष्य के संकेत? ड्यूश बैंक के शोध में इन पांच विषयों पर नज़र रखने की बात कही गई है | मिंट – news247online

आदित्य वर्मा

आदित्य वर्मा एक प्रौद्योगिकी विशेषज्ञ और लेखक हैं। वे नवीनतम गैजेट्स, सॉफ्टवेयर, और तकनीकी विकास पर लेख लिखते हैं। उन्होंने 10 वर्षों से टेक्नोलॉजी के क्षेत्र में काम किया है और उनकी लेखन शैली सरल और प्रभावशाली है।