एक प्रमुख शोध डेटाबेस फिर से भरोसे की परीक्षा से गुजर रहा है
पाँच लाख ब्रिटिश स्वयंसेवकों के गोपनीय स्वास्थ्य रिकॉर्ड्स अलीबाबा पर तीन अलग-अलग लिस्टिंग्स के माध्यम से बिक्री के लिए विज्ञापित किए गए थे, यह जानकारी यूके प्रौद्योगिकी मंत्री Ian Murray ने हाउस ऑफ कॉमन्स को दिए एक बयान में दी। यह डेटा UK Biobank से जुड़ा था, जो दुनिया के सबसे महत्वपूर्ण बायोमेडिकल शोध संसाधनों में से एक है और ब्रिटिश विज्ञान की आधारशिला माना जाता है।
लिस्टिंग्स अब हटा दी गई हैं, क्योंकि यूके सरकार ने अलीबाबा और चीनी सरकार के साथ काम किया, और Murray ने संसद को बताया कि ऐसा नहीं माना जाता कि कोई बिक्री हुई। लेकिन इस घटना ने UK Biobank में रखे डेटा की सुरक्षा को लेकर चिंताएं और बढ़ा दी हैं, जिसमें देश में कहीं भी एकत्र किए गए कुछ सबसे संवेदनशील शोध-संबंधी विवरण मौजूद हैं।
इस परियोजना में 500,000 स्वयंसेवकों का स्वास्थ्य डेटा शामिल है, जिसमें genome sequences, brain scans, blood samples, और diagnostic records हैं। दुनिया भर के विश्वविद्यालयों और निजी कंपनियों के वैज्ञानिकों को आवेदन प्रक्रिया के माध्यम से इस तक पहुंच मिलती है। यही वैज्ञानिक मूल्य इस ताज़ा exposure को इतना महत्वपूर्ण बनाता है: डेटासेट जितना अधिक समृद्ध और व्यापक रूप से उपयोग किया जाएगा, उतना ही अधिक भरोसा होना चाहिए कि इसकी सही तरह से सुरक्षा की जा रही है।
क्या उजागर हुआ, और अधिकारियों ने क्या कहा
Murray ने कहा कि UK Biobank चैरिटी ने सोमवार, 20 अप्रैल को सरकार को सूचित किया कि उसका डेटा चीन में Alibaba के ई-कॉमर्स प्लेटफॉर्म्स पर कई विक्रेताओं द्वारा बिक्री के लिए विज्ञापित किया गया था। उनके अनुसार, तीन डेटासेट्स में से कम से कम एक में सभी 500,000 स्वयंसेवकों का सहभागिता डेटा शामिल प्रतीत होता था।
मंत्री ने जानकारी को “de-identified” बताया, यानी स्पष्ट व्यक्तिगत पहचानकर्ता हटा दिए गए थे। लेकिन de-identified का अर्थ हानिरहित नहीं होता। UK Biobank का मूल्य उसकी जुड़ी हुई स्वास्थ्य जानकारी की गहराई और समृद्धि में है। प्रत्यक्ष पहचानकर्ताओं को हटाने के बाद भी, ऐसा डेटा अधिकृत चैनलों के बाहर संभाले जाने पर गंभीर नैतिक और सुरक्षा संबंधी चिंताएं पैदा कर सकता है।
UK Biobank ने स्वयं को Information Commissioner’s Office के पास संदर्भित किया है। यह संदर्भ संकेत देता है कि मामला साधारण platform moderation या अनधिकृत पुनर्विक्रय से आगे का है। अब यह एक नियामकीय मुद्दा है, जिसके governance, oversight, और बड़े पैमाने के स्वास्थ्य डेटा सिस्टम पर सार्वजनिक भरोसे से जुड़े निहितार्थ हैं।
यह उल्लंघन एक डेटाबेस से आगे क्यों मायने रखता है
यह घटना यूके डेटा नीति के लिए विशेष रूप से संवेदनशील समय में आई है। पिछले महीने, Guardian ने रिपोर्ट किया था कि संवेदनशील UK Biobank डेटा दर्जनों बार ऑनलाइन उजागर हुआ था, जिससे यह सवाल उठा कि क्या इस संसाधन के आसपास की सुरक्षा ढीली रही है। इसलिए ताज़ा लिस्टिंग्स किसी खाली जगह में नहीं आईं। वे ब्रिटेन के सबसे प्रसिद्ध वैज्ञानिक संसाधनों में से एक की सुरक्षा को लेकर बढ़ती चिंता के पैटर्न में फिट बैठती हैं।
यह इसलिए मायने रखता है क्योंकि UK Biobank कोई सीमित डेटाबेस नहीं है। इसे अक्सर यूके विज्ञान का रत्न कहा जाता है, और सही कारणों से। शोधकर्ता इसका उपयोग बीमारी के जोखिम, genetics, aging, और population health का बड़े पैमाने पर अध्ययन करने के लिए करते हैं। यदि प्रतिभागी या जनता यह मानने लगे कि डेटा सुरक्षा को गंभीरता से नहीं संभाला जा रहा, तो नुकसान केवल एक संस्था तक सीमित नहीं रहेगा। इससे biomedical data sharing और डिजिटल स्वास्थ्य शोध पर व्यापक भरोसा प्रभावित हो सकता है।
Commons science, innovation and technology committee की अध्यक्ष Chi Onwurah ने उल्लंघन को “अत्यंत गंभीर” बताया और कहा कि यह सार्वजनिक भरोसे पर एक और आघात है। उनका आकलन व्यापक दांव को दर्शाता है। शोध अवसंरचना केवल तकनीकी क्षमता पर नहीं, बल्कि सामाजिक वैधता पर भी निर्भर करती है। प्रतिभागियों को यह विश्वास होना चाहिए कि उनका डेटा जिम्मेदारी से उपयोग किया जाएगा और कुशलता से सुरक्षित रखा जाएगा।
राजनीति, डेटा शासन, और अंतरराष्ट्रीय तनाव
लिस्टिंग्स का एक चीनी ई-कॉमर्स प्लेटफॉर्म पर दिखाई देना पहले से ही कठिन कहानी में अंतरराष्ट्रीय आयाम जोड़ता है। Murray ने लिस्टिंग्स हटाने में त्वरित कार्रवाई के लिए चीनी सरकार का धन्यवाद किया। इसके विपरीत, Onwurah ने इस क्षण का उपयोग ब्रिटेन के स्वास्थ्य डेटा के खुलासे को दबाने के लिए विदेशी अधिकारियों पर निर्भर रहने की असहज छवि को रेखांकित करने के लिए किया।
मामले की राजनीति और तीखी हो जाती है क्योंकि UK Biobank में क्या है। ये साधारण ग्राहक रिकॉर्ड नहीं हैं। इनमें उन स्वयंसेवकों की अत्यंत संवेदनशील स्वास्थ्य जानकारी है, जिन्होंने एक दीर्घकालिक शोध परियोजना में इस अपेक्षा के साथ हिस्सा लिया था कि डेटा तक पहुंच का शासन होगा, व्यापार नहीं।
यह कहानी परियोजना में डेटा प्रवाह में हाल के बदलावों से भी जुड़ती है। फरवरी में, health secretary Wes Streeting ने एक legal direction जारी की, जिसने सभी स्वयंसेवकों का coded GP data पहली बार UK Biobank के साथ साझा करने की अनुमति दी। इस विस्तार से डेटाबेस का शोध मूल्य बढ़ता है, लेकिन किसी भी शासन विफलता के दांव भी बढ़ जाते हैं। डेटासेट जितना समृद्ध होगा, उतनी ही अधिक आवश्यकता होगी कि नियंत्रण, निगरानी, और प्रतिक्रिया प्रणालियां पर्याप्त हों।
“De-identified” आश्वासन की सीमाएं
अधिकारियों ने जोर दिया है कि विज्ञापित डेटा de-identified था, लेकिन सार्वजनिक भरोसा अक्सर केवल शब्दावली पर निर्भर नहीं करता। आधुनिक डेटा प्रणालियों में de-identification एक महत्वपूर्ण सुरक्षा उपाय है, लेकिन पूर्ण गारंटी नहीं। समृद्ध डेटासेट्स में अप्रत्यक्ष जोखिम हो सकते हैं, खासकर जब जुड़ा हुआ स्वास्थ्य डेटा शामिल हो और अनधिकृत exposure प्रतिभागियों के पूरे समूह से जुड़ा हो।
यही कारण है कि यह नवीनतम घटना, भले ही कोई बिक्री न हुई हो, फिर भी लंबे समय तक बनी रह सकती है। समस्या केवल यह नहीं है कि कोई transaction पूरी हुई या नहीं। समस्या यह है कि अनधिकृत listings मौजूद ही थीं, और कम से कम एक में सभी 500,000 प्रतिभागियों से जुड़े डेटा के होने का संकेत था। स्वैच्छिक भागीदारी पर आधारित परियोजना के लिए, यह सीमा अपने आप में ही चिंताजनक है।
ब्रिटिश विज्ञान अवसंरचना के लिए विश्वसनीयता की चुनौती
UK Biobank जनसंख्या स्वास्थ्य शोध के लिए सबसे शक्तिशाली संसाधनों में से एक बना हुआ है। इस घटना से यह तथ्य नहीं बदलता। लेकिन यह संस्था और सरकार पर यह साबित करने का बोझ जरूर बढ़ाता है कि डेटाबेस का governance उसके वैज्ञानिक महत्व के अनुरूप है।
तात्कालिक मुद्दा platform enforcement और नियामकीय अनुवर्ती कार्रवाई हो सकता है। दीर्घकालिक मुद्दा भरोसा है। यदि जनता इस तरह के प्रमुख डेटाबेस को लेकर बार-बार exposure की चिंता देखती है, तो केवल आश्वासन पर्याप्त नहीं रहेंगे। इसके बजाय जो बात मायने रखेगी वह है सुरक्षा प्रथाओं, access controls, auditing, और जवाबदेही के मजबूत होने का स्पष्ट प्रमाण।
यूके ने वर्षों से डेटा-समृद्ध बायोमेडिकल शोध को एक रणनीतिक राष्ट्रीय लाभ के रूप में प्रस्तुत किया है। उस लाभ को बनाए रखने के लिए, उसे यह साबित करना होगा कि वैज्ञानिक महत्वाकांक्षा और डेटा stewardship को समान रूप से गंभीर जिम्मेदारियां माना जा रहा है।
यह लेख The Guardian की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.
Originally published on theguardian.com




