होम विज्ञान AI और इंसान एक साथ कितनी अच्छी तरह काम कर सकते हैं?...

AI और इंसान एक साथ कितनी अच्छी तरह काम कर सकते हैं? वैज्ञानिक इसका पता लगाने के लिए डंगऑन और ड्रेगन की ओर रुख कर रहे हैं

14
0

कृत्रिम होशियारी (एआई) मॉडल लोकप्रिय टेबलटॉप रोल-प्लेइंग गेम डंगऑन एंड ड्रैगन्स (डी एंड डी) खेल रहे हैं ताकि शोधकर्ता दीर्घकालिक रणनीति बनाने और अन्य एआई सिस्टम और मानव खिलाड़ियों दोनों के साथ सहयोग करने की अपनी क्षमता का परीक्षण कर सकें।

में प्रस्तुत एक अध्ययन में न्यूरआईपीएस 2025 सम्मेलनजो सैन डिएगो में 2 दिसंबर से 7 दिसंबर तक चला, शोधकर्ताओं ने कहा कि गेम की रचनात्मकता और कठोर नियमों के अनूठे मिश्रण के कारण डी एंड डी एक इष्टतम परीक्षण बिस्तर है।

प्रयोगों के लिए, एक एकल मॉडल डंगऑन मास्टर (डीएम) की भूमिका निभा सकता है – वह व्यक्ति जो कहानी बनाता है और राक्षसों की भूमिका निभाता है – साथ ही एक नायक (प्रत्येक परिदृश्य में एक डीएम और चार नायक थे)। अध्ययन के लिए बनाए गए ढांचे में, जिसे डी एंड डी एजेंट कहा जाता है, मॉडल अन्य एलएलएम के साथ भी खेल सकते हैं, या मानव खिलाड़ी किसी भी या सभी भूमिकाओं को स्वयं भर सकते हैं। उदाहरण के लिए, एक एलएलएम डीएम की भूमिका निभा सकता है, जबकि दो एलएलएम और दो मानव खिलाड़ी नायक की भूमिका निभा सकते हैं।

अध्ययन के वरिष्ठ लेखक ने कहा, “डंगऑन और ड्रेगन मल्टीस्टेप योजना, नियमों और टीम रणनीति का पालन करने के मूल्यांकन के लिए एक प्राकृतिक परीक्षण मैदान है।” Raj Ammanabroluकैलिफोर्निया विश्वविद्यालय, सैन डिएगो के कंप्यूटर विज्ञान और इंजीनियरिंग विभाग में एक सहायक प्रोफेसर ने एक में कहा कथन. “क्योंकि खेल संवाद के माध्यम से सामने आता है, डी एंड डी मानव-एआई इंटरैक्शन के लिए एक सीधा रास्ता भी खोलता है: एजेंट अन्य लोगों की सहायता कर सकते हैं या उनके साथ सह-खेल सकते हैं।”

सिमुलेशन संपूर्ण D&D अभियान की नकल नहीं करता; इसके बजाय, यह युद्ध मुठभेड़ों पर ध्यान केंद्रित करता है, जिसे “” नामक पूर्व-लिखित साहसिक कार्य से लिया गया है।फैंडेलवर की खोई हुई खदान।” एक परीक्षण के पैरामीटर बनाने के लिए, टीम ने साहसिक कार्य से तीन युद्ध परिदृश्यों में से एक को चुना, चार पात्रों का एक सेट, और पात्रों की शक्ति का स्तर (निम्न, मध्यम या उच्च)। प्रत्येक एपिसोड 10 मोड़ तक चला, और फिर परिणाम एकत्र किए गए।

रणनीति और निर्णय लेने के लिए एक रूपरेखा

शोधकर्ताओं ने सिमुलेशन के माध्यम से तीन अलग-अलग एआई मॉडल चलाए – डीपसीक-वी3, क्लाउड हाइकु 3.5, और जीपीटी-4 – और मॉडल ने अन्य गुणों के साथ-साथ लंबी-क्षितिज योजना और उपकरण-उपयोग क्षमताओं का प्रदर्शन कैसे किया, इसके लिए एक मीट्रिक के रूप में डी एंड डी का उपयोग किया।

ये वास्तविक दुनिया के अनुप्रयोगों के लिए महत्वपूर्ण हैं, जैसे आपूर्ति श्रृंखला अनुकूलन या विनिर्माण लाइनें बनाना। उन्होंने यह भी परीक्षण किया कि मॉडल कितनी अच्छी तरह एक साथ समन्वय और योजना बना सकते हैं, जो आपदा प्रतिक्रिया मॉडलिंग या खोज-और-बचाव मल्टी-एजेंट सिस्टम जैसे परिदृश्यों पर लागू होगा।

कुल मिलाकर, क्लाउड हाइकू 3.5 ने सर्वोत्तम युद्ध दक्षता का प्रदर्शन किया, विशेष रूप से कठिन परिदृश्यों में। आसान परिदृश्यों में, संसाधन संरक्षण तीनों मॉडलों में काफी समान था। डी एंड डी में, संसाधन ऐसी चीजें हैं जैसे एक पात्र द्वारा प्रतिदिन उपयोग किए जा सकने वाले मंत्रों या क्षमताओं की संख्या या उपलब्ध उपचार औषधि की संख्या। चूँकि ये अलग-थलग युद्ध परिदृश्य थे, इसलिए बाद के लिए संसाधनों को बचाने के लिए बहुत कम प्रोत्साहन था, जैसा कि आप तब कर सकते थे जब आप एक पूर्ण साहसिक खेल खेल रहे हों।

अधिक कठिन परिस्थितियों में, क्लाउड हाइकू 3.5 ने अपने आवंटित संसाधनों को अधिक जलाने की अधिक इच्छा दिखाई, जिससे बेहतर परिणाम मिले। GPT-4 बहुत पीछे था, और DeepSeek-V3 को सबसे अधिक संघर्ष करना पड़ा।

शोधकर्ताओं ने यह भी मूल्यांकन किया कि मॉडल पूरे सिमुलेशन के दौरान अपने चरित्र में कितनी अच्छी तरह रह सकते हैं। उन्होंने एक अभिनय गुणवत्ता मीट्रिक बनाई, जिसने मॉडलों के वर्णनात्मक भाषण (पाठ प्रतिक्रियाओं के रूप में उत्पन्न) को अलग किया और यह संतुलित किया कि मॉडल खेल के दौरान कितनी आवाजों के साथ चरित्र में बने रहे।

उन्होंने पाया कि डीपसीक-वी3 बहुत सारे सारगर्भित, प्रथम-व्यक्ति भौंकने और ताने उत्पन्न करता है (जैसे कि “मैं बाईं ओर चला गया” या “उन्हें पकड़ो!”) लेकिन यह अक्सर उन्हीं आवाज़ों का पुन: उपयोग करता है। दूसरी ओर, क्लॉड हाइकु 3.5 ने अपने उच्चारण को विशेष रूप से उस वर्ग या राक्षस के अनुरूप बनाया, जिसका वह किरदार निभा रहा था, चाहे वह होली पलाडिन हो या प्रकृति-प्रेमी ड्र्यूड। इस बीच, GPT-4, बीच में कहीं गिर गया, जिससे इन-कैरेक्टर कथन और मेटा-टैक्टिकल वाक्यांशों का मिश्रण तैयार हुआ।

कुछ सबसे दिलचस्प और अनोखे कॉम्बैट बार्क तब आए जब मॉडल राक्षसों की भूमिका निभा रहे थे। अलग-अलग प्राणियों ने अलग-अलग व्यक्तित्व विकसित करना शुरू कर दिया, जिससे युद्ध के बीच में राक्षस चिल्लाने लगे: “हे – चमकदार आदमी का खून बहने वाला है!”

शोधकर्ताओं ने कहा कि इस प्रकार का परीक्षण ढांचा यह मूल्यांकन करने के लिए महत्वपूर्ण है कि मॉडल लंबे समय तक मानव इनपुट के बिना कितनी अच्छी तरह काम कर सकते हैं। यह एआई की सुसंगत और विश्वसनीय रहते हुए स्वतंत्र रूप से कार्य करने की क्षमता का एक माप है – एक ऐसी क्षमता जिसके लिए स्मृति और रणनीतिक सोच की आवश्यकता होती है।

भविष्य में, टीम पूर्ण डी एंड डी अभियानों को लागू करने की उम्मीद करती है जो युद्ध के बाहर सभी कथा और कार्रवाई को मॉडल करते हैं, एआई की रचनात्मकता और लोगों या अन्य एलएलएम से इनपुट के जवाब में सुधार करने की क्षमता पर जोर देते हैं।