एआई केवल मनुष्यों के रूप में बीमारी का निदान करने में अच्छा है
अपनी तरह की पहली व्यवस्थित समीक्षा और मेटा-विश्लेषण से पता चलता है कि कृत्रिम बुद्धिमत्ता (एआई) चिकित्सा छवि के आधार पर एक बीमारी का निदान करने में उतना ही अच्छा है जितना कि स्वास्थ्य सेवा पेशेवर। हालांकि, अधिक उच्च गुणवत्ता वाले अध्ययन आवश्यक हैं।
एआई और हेल्थकेयर पेशेवर चिकित्सा इमेजिंग के आधार पर बीमारी के निदान में समान रूप से प्रभावी हैं, नए शोध से पता चलता है।एक नया लेख यह निर्धारित करने के प्रयास में मौजूदा साक्ष्यों की जांच करता है कि क्या एआई स्वास्थ्य बीमा पेशेवरों के रूप में बीमारियों का प्रभावी ढंग से निदान कर सकता है।
लेखकों के ज्ञान के लिए - अर्थात, यूनाइटेड किंगडम में यूनिवर्सिटी हॉस्पिटल्स बर्मिंघम एनएचएस फाउंडेशन ट्रस्ट के प्रोफेसर अलस्टेयर डेनिस्टन के नेतृत्व में शोधकर्ताओं की एक विशाल टीम - यह पहली व्यवस्थित समीक्षा है जो सभी रोगों के लिए चिकित्सा पेशेवरों के साथ एआई प्रदर्शन की तुलना करती है।
प्रो। डेनिस्टन और टीम ने 1 जनवरी 2012 और 6 जून 2019 के बीच प्रकाशित सभी अध्ययनों के लिए कई मेडिकल डेटाबेस की खोज की। टीम ने पत्रिका में उनके विश्लेषण के परिणाम प्रकाशित किए। लैंसेट डिजिटल हेल्थ.
स्वास्थ्य पेशेवरों के साथ एक सममूल्य पर एअर इंडिया
शोधकर्ताओं ने उन अध्ययनों की तलाश की, जिनमें हेल्थकेयर पेशेवरों के साथ गहन शिक्षण एल्गोरिदम की नैदानिक प्रभावशीलता की तुलना की गई जब उन्होंने चिकित्सा इमेजिंग के आधार पर निदान किया था।
उन्होंने कहा कि अध्ययन में रिपोर्टिंग की गुणवत्ता, उनके नैदानिक मूल्य और अध्ययन के डिजाइन की जांच की गई।
इसके अलावा, जब हेल्थकेयर पेशेवरों की तुलना में एआई के नैदानिक प्रदर्शन का आकलन करने की बात आई, तो शोधकर्ताओं ने दो परिणामों पर गौर किया: विशिष्टता और संवेदनशीलता।
"संवेदनशीलता" इस संभावना को परिभाषित करती है कि निदान उपकरण को उन लोगों में सकारात्मक परिणाम मिलता है जिनके पास बीमारी है। विशिष्टता नैदानिक परीक्षण की सटीकता को संदर्भित करती है, जो संवेदनशीलता माप को पूरक करती है।
चयन प्रक्रिया में केवल 14 अध्ययन हुए जिनकी गुणवत्ता विश्लेषण में शामिल करने के लिए पर्याप्त थी। प्रो। डेनिस्टन बताते हैं, "हमने 20,500 से अधिक लेखों की समीक्षा की, लेकिन इनमें से 1% से भी कम उनके डिज़ाइन और रिपोर्टिंग में पर्याप्त मजबूत थे कि स्वतंत्र समीक्षकों को उनके दावों पर अधिक भरोसा था।"
"क्या अधिक है, केवल 25 अध्ययनों ने एआई मॉडल को बाहरी रूप से मान्य किया (एक अलग आबादी से चिकित्सा छवियों का उपयोग करके), और एक ही परीक्षण नमूने का उपयोग करके एआई और स्वास्थ्य पेशेवरों के प्रदर्शन की तुलना में सिर्फ 14 अध्ययन।"
"उच्च गुणवत्ता वाले अध्ययन के मुट्ठी भर के भीतर, हमने पाया कि गहरी शिक्षा वास्तव में कैंसर से लेकर आंखों की बीमारियों तक का सटीक रूप से स्वास्थ्य पेशेवरों के रूप में पता लगा सकती है। लेकिन यह ध्यान रखना महत्वपूर्ण है कि एआई ने मानव निदान को बेहतर ढंग से समझा नहीं। "
एलेस्टेयर डेनिस्टन प्रो
अधिक विशेष रूप से, विश्लेषण में पाया गया कि एआई 87% मामलों में बीमारी का सही निदान कर सकता है, जबकि स्वास्थ्य पेशेवरों द्वारा पता लगाने पर 86% सटीकता दर मिली। डीप लर्निंग एल्गोरिदम की विशिष्टता 93% थी, जबकि मनुष्यों की 91% थी।
बायसेज़ एआई प्रदर्शन को बढ़ा सकते हैं
प्रो। डेनिस्टन और सहकर्मी एआई नैदानिक प्रदर्शन की जांच करने वाले अध्ययनों में मिली कई सीमाओं की ओर ध्यान आकर्षित करते हैं।
सबसे पहले, अधिकांश अध्ययन एआई और हेल्थकेयर पेशेवरों की एक अलग सेटिंग में नैदानिक सटीकता की जांच करते हैं जो नियमित नैदानिक अभ्यास की नकल नहीं करते हैं - उदाहरण के लिए, अतिरिक्त नैदानिक जानकारी के डॉक्टरों को वंचित करने से उन्हें आमतौर पर निदान करने की आवश्यकता होगी।
दूसरे, शोधकर्ताओं का कहना है, ज्यादातर अध्ययन केवल डेटासेट की तुलना करते हैं, जबकि नैदानिक प्रदर्शन में उच्च गुणवत्ता वाले शोध को लोगों में ऐसी तुलना करने की आवश्यकता होगी।
इसके अलावा, सभी अध्ययनों को खराब रिपोर्टिंग से सामना करना पड़ा, लेखकों का कहना है कि विश्लेषण के साथ जानकारी के लिए लेखांकन नहीं है जो उक्त डेटासेट से गायब था। "अधिकांश अध्ययनों] ने यह नहीं बताया कि कोई डेटा गायब था, इस अनुपात का प्रतिनिधित्व किस अनुपात में किया गया था, और विश्लेषण में डेटा को कैसे गायब किया गया था"।
अतिरिक्त सीमाओं में असंगत शब्दावली शामिल है, जो संवेदनशीलता और विशिष्टता विश्लेषण के लिए स्पष्ट रूप से एक सीमा निर्धारित नहीं करती है, और नमूना सत्यापन की कमी है।
"पहले अभ्यास डॉ। Xiaoxuan लियू से टिप्पणी है," एक नया तरीका है, संभावित रूप से जीवन रक्षक डायग्नॉस्टिक्स और उच्च गुणवत्ता वाले साक्ष्य को विकसित करने की इच्छा के बीच एक अंतर्निहित तनाव है, जिससे मरीजों और स्वास्थ्य प्रणालियों को नैदानिक व्यवहार में फायदा हो सकता है। " बर्मिंघम विश्वविद्यालय।
“हमारे काम से एक महत्वपूर्ण सबक यह है कि एआई में - स्वास्थ्य देखभाल के किसी अन्य भाग के साथ - अच्छा अध्ययन डिजाइन मामले। इसके बिना, आप आसानी से पूर्वाग्रह का परिचय दे सकते हैं जो आपके परिणामों को रोक देता है। ये पूर्वाग्रह एआई उपकरणों के अच्छे प्रदर्शन के अतिरंजित दावों को जन्म दे सकते हैं जो वास्तविक दुनिया में अनुवाद नहीं करते हैं। ”
डॉ। ज़ियाक्सुआन लियू
Moorfields Eye Hospital, London, UK के सह-लेखक डॉ। लिविया फ़ेस कहते हैं, "एआई एल्गोरिदम कैसे रोगी के परिणामों को बदल देगा, इस पर यादृच्छिक नियंत्रित परीक्षणों में तुलनात्मक निदान परीक्षणों से आने की आवश्यकता है, इस पर साक्ष्य।"
"अब तक, शायद ही कोई ऐसा परीक्षण हुआ हो जिसमें एआई एल्गोरिथ्म द्वारा किए गए नैदानिक निर्णयों को देखने के लिए कार्य किया जाता है, जो तब परिणाम के लिए होता है जो रोगियों के लिए वास्तव में मायने रखता है, जैसे समय पर उपचार, अस्पताल से छुट्टी का समय, या यहां तक कि जीवित रहने की दर।"