जब एआई गलती करता है तो उसका ज़िम्मेदार कौन है? | by Cassie Kozyrkov | Nov, 2020

हिंदी अनुवाद: आयुष मिश्रा, (Aayush Mishra)

मूल लेख: कैसी कॉज़ीरकोव (Cassie Kozyrkov)

संपादिका: प्रियंका वरगड़ीआ (Priyanka Vergadia)

मुझे गलत मत समझें, मशीन लर्निंग और एआई मुझे बहुत प्यारे हैं। लेकिन मैं उन पर आंख मूंदकर भरोसा नहीं कर सकती हूँ और न ही आपको करना चाहिए, क्योंकि जिस तरह से आप प्रभावी और विश्वसनीय एमएल / एआई समाधान निकालते हैं, ऐसा करने के लिए पहले हर एक समाधान को आपका विश्वास जीतना ही होगा।

(इस लेख में बहुत सी सलाह डटा इन्साइट्स और एमएल/एआई के बिना बनाए गए मॉडल पर भी लागू होती है, विशेष रूप से अंतिम पैराग्राफ में कही गई बातें ।)

ब्लाइंड ट्रस्ट करना बहुत बुरी चीज़ है

इससे पहले कि आप यह सोचना शुरू करें कि इसका रोबोट या साई-फाई से कुछ लेना-देना है, उससे पहले ही रुक जाइए! एमएल/ एआई सिस्टम मानवीय नहीं हैं, यह सिर्फ चीज़ों को लेबल देने का काम करते हैं । इसकी बजाए उनकी अविश्वसनीयता पूरी तरह से कहीं और से आती है। मुझे लगता है कि इसे बताने कि बजाए इसे दिखाना ज्यादा बेहतर होगा, तो आइए इसका एक जाना पहचाना उदाहरण देखते हैं…

[स्पोइलर अलर्ट: यह लेख आपको मेरे बताए गए डैमो के लिए इम्यून कर सकता हैं, जिसके कारण आपके लिए अनसुपरवाईस्ड लर्निंग का पर्दा फ़ाश को पढ़ने का मज़ा खराब हो सकता है।]

एमएल या एआई पर कभी भी आंख मूंदकर भरोसा न करें, हमेशा उचित सही टेस्टिंग के साथ उसे विश्वास जीतने के लिए मजबूर करें। इमेज: सोर्स।

हमारी बिल्लियों के बीच आपका स्वागत है, जिनसे आप पहले ही मिल चुके हैं जब हमने छह तस्वीरों के अपने मूल डेटासेट को दो समूहों में विभाजित करने के लिए एक क्लासिफायर बनाया था।

ये ओरिजनल डेटासेट अनसुपरवाईस्ड लर्निंग का पर्दा फ़ाश से लिया गया है। क्या आप इन दो समूहों को देख सकते हैं?

क्या आप ये देख सकते हैं? मेरा अद्भुत जादुई मशीन लर्निंग सिस्टम सटीक परिणाम देने में सफल रहा, जिसकी मैं उम्मीद कर रही थी!

यह उदाहरण सुपरवाईस्ड एमएल और अनसुपरवाईस्ड एमएल दोनों के लिए काम करता है, इसलिए इसके बारे में चिंता न करें। महत्वपूर्ण बात यह है कि मॉडल पूरी तरह 100% सटीकता के साथ मेरी दो बिल्लियों की पहचान करता है।

वाह! ये दो अलग-अलग बिल्लियों है और ये मॉडल इन दोनों को ही एकदम सही लेबल देने में सफल होता है, जिस कारण मुझे अपने इस क्लाससिफाईबोट पर बहुत गर्व महसूस होता है। इसका मतलब है कि मैंने सिर्फ टेस्ला और हक्सले का क्लासिफायर बनाया है !!! …सही कहा ना?

इतनी जल्दी नहीं! यही हमारी खयाली पुलाव पकाने वाली सोच है जो हमारे साथ फिर से छलावा कर रही है। मैं अपनी बिल्लियों के साथ इतनी भावुक हो गई कि शायद मैंने यह ध्यान नहीं दिया कि सभी टेस्ला तस्वीरों के बैकग्राउन्ड में एक रेडिएटर मौजूद है और सभी हक्सले तस्वीरें के पीछे नहीं है। क्या आपने यह बात नोटिस कि? इसे दोबारा देखिए।

यह सिस्टम कभी भी कैट डिटेक्टर नहीं था। मैं कन्फर्मेशन बायस के कारण सीधे इस निष्कर्ष पर पहुँच गई, जिसके कारण मैंने उस सबूत का चुनाव किया जो मेरी मन पसंद कहानी कि पुष्टि करता है और उस सबूत को नोटिस करने में विफल रही जो बताता है कि सिस्टम वास्तव में एक रेडिएटर डिटेक्टर है।

यह सिस्टम कभी भी कैट डिटेक्टर नहीं था। मैं कन्फर्मेशन बायस के कारण सीधे इस निष्कर्ष पर पहुँच गई, जिसके कारण मैंने उस सबूत का चुनाव किया जो मेरी मन पसंद कहानी कि पुष्टि करता है और उस सबूत को नोटिस करने में विफल रही जो बताता है कि सिस्टम वास्तव में एक रेडिएटर डिटेक्टर है।

असल में मेरा सॅाल्यूशन — जिससे मैं अनजान थी — वास्तव में एक रेडिएटर डिटेक्टर है, न कि हक्सले /टेसला डिटेक्टर। नए उदाहरणों के साथ टेस्टिंग करने कि प्रतिष्ठा है कि वह मददगार साबित होता है, तो चलिए देखते हैं कि क्या हम इस तरह से समस्या को पकड़ने में सफल होते हैं या नहीं …

यह बात सामने आती है कि एक ही डेटासेट के उदाहरणों का उपयोग करने से ज्यादा फर्क नहीं पड़ता और कोई समाधान नहीं निकलता है।

यहां तक ​​कि अगर मैं नए डेटा के साथ भी इसे नई तस्वीरों को दिखा कर भी टेस्टिंग करती हूं, तो भी बहुत कुछ फर्क नहीं पड़ेगा। बाप रे। क्या यही समस्या है?

ऐसा नहीं होगा अगर टेसला हमेशा रेडिएटर के साथ फोटो खिंचवाती है और हक्सले हमेशा उसके बिना। अगर ऐसा है, तो कौन परवाह करता है कि यह कैसे काम करता है? यह हमेशा काम करेगा। यह हर बार सही बिल्ली बताएगा। इसमें कोई समस्या नहीं है।

यह एक बड़ा अगर है। अगर बिल्लियाँ दूसरे अपार्टमेंट (सच्ची कहानी) में चली जाएं तो क्या होगा? क्या होगा अगर आप मेरे नोट्स के बिना मेरे क्लासिफायर का इस्तेमाल करें और इसे अपनी तस्वीरों पर इस्तेमाल करें?

ऐसे मामलों में, आपको जो लेबल मिलेगा वो “हक्सले” होगा और अगर मेरे इस हक्सले / टेसला डिटेक्टर पर जो भी मिशन-क्रिटिकल सिस्टम निर्भर रहेगा वह बुरी तरह से दुर्घटनाग्रस्त हो जाएगा।

जब तक आग भड़क रही है तब तक हम जल्दी से एक पोस्टमॉर्टम कर के देख लेते हैं:

  • जैसा कि एआई के साथ ये आम बात है, पिक्सल को लेबल में कनवर्ट करने वाली रेसिपी को समझना मेरे लिए बहुत ही मुश्किल काम है
  • मैंने सिर्फ इनपुट (पिक्सल) और आउटपुट ( हक्सले/टेसला लेबल ) को ही देखा है।
  • क्योंकि मैं मानव हूँ , मैं उन चीजों को नोटिस करने में चूक जाती हूँ जो मेरी नाक के नीचे मौजूद हैं (रेडिएटर और टेसला हमेशा एक दूसरे में घुल-मिल जाते हैं )।
  • जो कहानी मैं खुद को बताती हूं कि किस तरह से इनपुट, आउटपुट से संबंधित हैं , यह बात ना सिर्फ बहुत ही सरल है बल्कि ये रेडिएटर वाले स्पष्टीकरण को खयाली पुलाव पकाने वाली सोच से भी दूर करती है।
  • यह भी ठीक है। मुझे यह तब तक समझने की ज़रूरत नहीं है कि यह कैसे काम करता है जब तक मैं यह सुनिश्चित नहीं कर लेती हूँ कि यह काम करता है।
  • यह देखने के लिए कि यह कैसे काम करता है, यह जाँचना होगा कि यह नए उपयोगी उदाहरणों के साथ कैसा काम करता है जिसे इसने पहले नहीं देखा है।

अब तक सब ठीक है। वास्तव में अभी तक कोई समस्या नहीं आई है। आप बहुत सारी चीजों पर भरोसा करते हैं बिना यह जाने कि वे कैसे काम करती हैं, उदाहरण के लिए पेरासिटामोल हममें से कई लोग अपने सिरदर्द के लिए लेते हैं। यह काम करता है, फिर भी विज्ञान आपको यह नहीं बता सकता है कि कैसे। महत्वपूर्ण बात यह है कि आप यह सत्यापित कर सकते हैं कि पेरासिटामोल काम करता है ( अपने सिर पर एक मृत तिल रखने जैसी चीजों से अलग)।

पता नहीं यह लोकप्रिय 100+ वर्ष पुरानी दवा मोलेक्यूलर स्तर पर कैसे काम करती है? और न ही विज्ञान को इस बात का पता है।

जटिल एआई सिस्टम के बारे में उसी तरह सोचें जैसे आप सिरदर्द के इलाज के बारे में सोचते हैं। सुनिश्चित करें कि वे काम करते हैं और आप ठीक हो जाएंगे। तो इसे दिखाया कैसे जाएगा ? ड्रम बजाया जाए प्लीज़!

  • दुर्भाग्य से, मैं उन उदाहरणों के साथ परफॉरमेंस कि जांच करती हूं जो जिन्हें मैं नहीं चाहूँगी कि वो मेरे सिस्टम में उपयोग किए जाएं।

यह रहा वो। इस आखिरी जगह ही सब बुरी तरह से गलत हो गया है। बाकी सब तब तक ठीक हैं जब तक हम उचित उदाहरणों के साथ सिस्टम कि टेस्टिंग करते हैं। तो इसका जवाब है: यह मेरी मानवीय गलती है।

यदि आप एक काम के लिए सिस्टम को टेस्ट करते हैं और फिर इसे दूसरे पर लागू करते हैं … तो आप इससे क्या उम्मीद करते हैं?

अगर मैं किसी छात्र को उन उदाहरणों के ज़रिए का उपयोग पढ़ाती हूं जो उस कार्य को नहीं सिखाता है जो मैं चाहती हूं कि छात्र सीखें, तो बाद में गड़बड़ होने पर मुझे आश्चर्य क्यों होना चाहिए? यदि मेरे सभी उदाहरण उस दुनिया से हैं, जहां टेसला और रेडिएटर हमेशा साथ-साथ चलते हैं, तो मैं केवल अपने क्लासिफायर से उस दुनिया में काम करने की उम्मीद कर सकती हूं। जब मैं इसे एक अलग दुनिया में ले जाती हूं, तो मैं इसे वहां रख रही हूं जहां यह नहीं है। उम्मीद करती हूँ कि इस ऐप्लिकेशन पर ज्यादा कुछ दांव पर नहीं लगा हो क्योंकि इसके लिए आपके पास कोई बहाना नहीं होगा कि “उफ़, लेकिन मुझे नहीं पता था कि यह उस सेटिंग के बाहर काम नहीं करेगा जिसके लिए इसे बनाया गया था।” आपको पता हैं। और अगर आप पहले नहीं जानते थे, तो अब आप जानते हैं।

इसलिए यह बहुत जरूरी हैं कि आप अपने गोल्स और यूजर्स को शुरुआत से ही ध्यान में रखकर आगे बढ़ें। शुरुआत करने से पहले ही आप सभी जरूरी आवश्यक्ताओं (स्पेसिफिकेशन) और सेटिंग्स को ध्यान में रखें। और कृपा करके एक जिम्मेदार इंसान को इस काम पर लगाएं या फिर बस टॉय ऐप्लिकेशन से ही काम चलाएं।

जहां बड़ी चीजें दांव पर लगी हों, तब वहाँ बस गैर जरूरी डेटासेट्स पर अनउपयोगी प्रचलित शब्दों का इस्तेमाल करने से बस काम नही होगा ।

कुशल और जिम्मेदार नेतृत्व के बिना, मुझे पूरी उम्मीद है कि आपका ऐप्लिकेशन पर किसी का स्वास्थ्य, सुरक्षा, गरिमा, या भविष्य निर्भर ना हो …

मैं “उदाहरण” शब्द का उपयोग “डेटा” कि जगह कर रही हूं — आपको याद दिलाने के लिए कि यह जादू नहीं है, ये दोनों एक ही चीज़ें हैं। एमएल/एआई का मकसद ही यह है कि आप निर्देशों के बजाए उदाहरण का उपयोग करते हुए अपनी इच्छा व्यक्त करते हैं। इसे काम करने के लिए, उदाहरणों का सही होना ज़रूरी है। कार्य जितना जटिल होगा, उतने अधिक उदाहरणों की आवश्यकता होगी। आप हर दिन उदाहरणों का उपयोग करके संवाद करते हैं, इसलिए आप इस बात को पहले से ही जानते हैं। शायद आप सोच रहे थे कि क्या गणित कुछ अलग बात कहता है; जी नहीं। निश्चिंत रहें, आपका सामान्य ज्ञान ही अब तब सबसे अच्छा एल्गोरिथ्म रहा है।

यदि आप उदाहरणों के साथ सिखाना चाहते हैं, तो उदाहरणों को अच्छा होना जरूरी है। यदि आप अपने छात्र पर भरोसा करना चाहते हैं, तो उसके लिए परीक्षा का अच्छा होना जरूरी।

आप अपने सिस्टम की सुरक्षा के बारे में नहीं जानते हैं कि यह आपकी जाँची हुई स्थितियों के अलावा दूसरी स्थितियों में कैसा काम करेगा, इसलिए यह रिमाइंडर्स आपके लिए मददगार होंगे:

  • यदि आपने इसकी टेस्टिंग नहीं की है, तो इस पर भरोसा न करें।
  • यदि आपने इसकी टेस्टिंग उस [स्थिति] में नहीं की है, तो उस [स्थिति] पर भरोसा न करें।
  • यदि आपने [यूजर पॉप्यूलेशन] के साथ इसकी टेस्टिंग नहीं की है, तो [यूजर पॉप्यूलेशन] पर भरोसा न करें।
  • यदि आपने [डेटा पॉप्यूलेशन] के साथ इसकी टेस्टिंग नहीं की है, तो [डेटा पॉप्यूलेशन] पर भरोसा न करें।
  • यदि कोई इनपुट असामान्य है, तो अपने सिस्टम से कुछ अच्छा आउट्पुट मिलने कि उम्मीद ना करें। उसकी जगह आप आउटलायर डिटेक्शन और सेफ्टी नेट्स का उपयोग करने पर विचार करें (जैसे किसी असामान्य उदाहरण को चिह्नित करने के लिए मानवीय मदद लेने के लिए चिन्हित करना)।

यदि आप एक उपकरण का उपयोग किसी ऐसी जगह करते हैं, जहाँ उसका उपयोग सुरक्षित नहीं बताया गया है, तो इसके कारण जो भी गड़बड़ी होगी उसके ज़िम्मेदार केवल आप रहेंगे। एआई भी किसी दूसरे उपकरण कि तरह ही है।

Share:

More Posts

Send Us A Message