आघाडीचा संशोधन डेटाबेस पुन्हा विश्वासाच्या कसोटीवर

अर्धा दशलक्ष ब्रिटिश स्वयंसेवकांच्या गोपनीय आरोग्य नोंदी Alibaba वर तीन वेगवेगळ्या लिस्टिंगद्वारे विक्रीसाठी जाहिरात करण्यात आल्याची माहिती UK तंत्रज्ञानमंत्री Ian Murray यांनी House of Commons मधील निवेदनात दिली. हा डेटा UK Biobank शी संबंधित होता; तो जगातील सर्वात महत्त्वाच्या जैववैद्यकीय संशोधन संसाधनांपैकी एक आणि ब्रिटिश विज्ञानाचा कणा आहे.

UK सरकारने Alibaba आणि चिनी सरकारसोबत काम केल्यानंतर त्या लिस्टिंग्ज आता हटवण्यात आल्या आहेत, आणि Murray यांनी संसदेत सांगितले की कोणतीही विक्री झाली असे मानले जात नाही. तरीही या घटनेमुळे UK Biobank मध्ये साठवलेल्या डेटाच्या सुरक्षिततेबाबतची चिंता वाढली आहे; त्या डेटासेटमध्ये देशात कुठेही संकलित करण्यात आलेली काही सर्वात संवेदनशील संशोधन माहिती आहे.

या प्रकल्पात 500,000 स्वयंसेवकांचा आरोग्य डेटा आहे, ज्यात genome sequences, brain scans, blood samples, आणि diagnostic records यांचा समावेश आहे. जगभरातील विद्यापीठे आणि खासगी कंपन्यांतील शास्त्रज्ञांना अर्ज प्रक्रियेद्वारे प्रवेश दिला जातो. हाच वैज्ञानिक मूल्य या ताज्या उघडकीला इतके महत्त्व देतो: डेटासेट जितका अधिक समृद्ध आणि व्यापक वापरात असेल, तितकी त्याचे योग्य संरक्षण होत असल्याची खात्री अधिक आवश्यक असते.

काय उघड झाले, आणि अधिकाऱ्यांनी काय सांगितले

Murray यांनी सांगितले की सोमवार, 20 एप्रिल रोजी UK Biobank चॅरिटीने सरकारला कळवले की चीनमधील Alibaba च्या ई-कॉमर्स प्लॅटफॉर्मवर अनेक विक्रेत्यांनी त्यांचा डेटा विक्रीसाठी जाहिरात केला होता. त्यांच्या म्हणण्यानुसार, तीन डेटासेटपैकी किमान एकामध्ये 500,000 सर्व स्वयंसेवकांचा सहभाग-संबंधित डेटा असल्याचे दिसत होते.

मंत्र्यांनी ही माहिती “de-identified” अशी वर्णन केली, म्हणजे स्पष्ट वैयक्तिक ओळखचिन्हे काढून टाकण्यात आली होती. पण de-identified म्हणजे निरुपद्रवी असे नाही. UK Biobank चे मूल्य त्याच्या जोडलेल्या आरोग्य माहितीतल्या खोलीत आणि समृद्धीत आहे. थेट ओळखचिन्हे काढून टाकल्यानंतरही, असा डेटा अधिकृत चॅनेल्सबाहेर हाताळला गेल्यास मोठ्या नैतिक आणि सुरक्षेच्या चिंता निर्माण करू शकतो.

UK Biobank ने स्वतःला Information Commissioner’s Office कडे संदर्भित केले आहे. हा संदर्भ सूचित करतो की हा विषय सामान्य platform moderation किंवा अनधिकृत पुनर्विक्रीपेक्षा पुढचा आहे. आता हा एक नियामक मुद्दा आहे, ज्याचे governance, oversight, आणि मोठ्या आरोग्य-डेटा प्रणालींवरील सार्वजनिक विश्वास यावर परिणाम आहेत.

एका डेटाबेसपलीकडे हा भंग का महत्त्वाचा आहे

ही घटना UK डेटा धोरणासाठी अतिशय संवेदनशील क्षणी आली आहे. गेल्या महिन्यात Guardian ने नोंदवले होते की संवेदनशील UK Biobank डेटा अनेक वेळा ऑनलाइन उघड झाला होता, ज्यामुळे या संसाधनाभोवतीची सुरक्षा पुरेशी सैल आहे का, असा प्रश्न निर्माण झाला. त्यामुळे ताज्या लिस्टिंग्ज रिकाम्या पोकळीत आलेल्या नाहीत. ब्रिटनच्या सर्वात मान्यताप्राप्त वैज्ञानिक संपत्तीपैकी एक कशी सुरक्षित केली जाते आहे, याबाबतच्या वाढत्या चिंतेच्या नमुन्यात त्या बसतात.

हे महत्त्वाचे आहे कारण UK Biobank हा एखादा किरकोळ डेटाबेस नाही. त्याला योग्य कारणाने UK विज्ञानाचे jewel म्हटले जाते. संशोधक त्याचा वापर रोगजोखीम, genetics, aging, आणि population health यांचा मोठ्या प्रमाणावर अभ्यास करण्यासाठी करतात. सहभागी किंवा जनतेला जर वाटले की डेटा सुरक्षा गंभीरपणे हाताळली जात नाही, तर नुकसान एका संस्थेपुरते मर्यादित राहणार नाही. त्याचा परिणाम biomedical data sharing आणि digital health research वरील व्यापक विश्वासावर होऊ शकतो.

Commons science, innovation and technology committee च्या अध्यक्षा Chi Onwurah यांनी या भंगाला “incredibly serious” म्हटले आणि तो सार्वजनिक विश्वासाला आणखी एक धक्का असल्याचे सांगितले. त्यांची मांडणी व्यापक stakes दाखवते. संशोधन पायाभूत सुविधा केवळ तांत्रिक क्षमतेवर नाही तर सामाजिक वैधतेवरही अवलंबून असते. सहभागींनी असा विश्वास ठेवायला हवा की त्यांचा डेटा जबाबदारीने वापरला जाईल आणि सक्षमपणे सुरक्षित ठेवला जाईल.

राजकारण, डेटा प्रशासन, आणि आंतरराष्ट्रीय तणाव

लिस्टिंग्ज एका चिनी ई-कॉमर्स प्लॅटफॉर्मवर दिसल्यामुळे आधीच कठीण असलेल्या कथेला आंतरराष्ट्रीय आयाम मिळाला. लिस्टिंग्ज पटकन काढण्यात मदत केल्याबद्दल Murray यांनी चिनी सरकारचे आभार मानले. उलटपक्षी, ब्रिटनचा आरोग्य डेटा उघड होणे दाबण्यासाठी परदेशी अधिकाऱ्यांवर अवलंबून राहावे लागल्याच्या अस्वस्थ वास्तवावर Onwurah यांनी भर दिला.

या प्रकरणातील राजकीय सूर UK Biobank मध्ये काय आहे यामुळे अधिक तीव्र होतो. ही सामान्य ग्राहक नोंदी नाहीत. दीर्घकालीन संशोधन प्रकल्पात सहभागी झालेल्या स्वयंसेवकांकडून मिळालेली अतिशय संवेदनशील आरोग्य माहिती आहे; त्यांची अपेक्षा होती की डेटा प्रवेश नियंत्रित असेल, व्यापारात आणला जाणार नाही.

ही कथा प्रकल्पात अलीकडे झालेल्या data flows बदलांशीही जोडलेली आहे. फेब्रुवारीत, health secretary Wes Streeting यांनी एक legal direction जारी केली, ज्यामुळे सर्व स्वयंसेवकांचा coded GP data प्रथमच UK Biobank सोबत सामायिक करण्यास परवानगी मिळाली. त्या विस्तारामुळे डेटाबेसचे संशोधनमूल्य वाढते, पण कोणत्याही governance अपयशाचे stakesही वाढतात. डेटासेट जितका समृद्ध होईल, तितकी नियंत्रणं, निरीक्षण, आणि प्रतिसाद यंत्रणा पुरेशी आहेत का याची खात्री अधिक महत्त्वाची होते.

“De-identified” हमीच्या मर्यादा

अधिकाऱ्यांनी भर दिला आहे की जाहिरात केलेला डेटा de-identified होता, पण सार्वजनिक विश्वास बहुतेक वेळा फक्त शब्दावलीवर अवलंबून नसतो. आधुनिक डेटा प्रणालींमध्ये de-identification हा महत्त्वाचा सुरक्षा उपाय आहे, पण तो पूर्ण हमी नाही. समृद्ध डेटासेटमध्ये अप्रत्यक्ष धोके राहू शकतात, विशेषतः जोडलेली आरोग्य माहिती असेल आणि अनधिकृत exposure संपूर्ण cohort शी संबंधित असेल तर.

म्हणूनच, ताजी घटना विक्री झाली नसली तरीही दीर्घकाळ टिकू शकते. समस्या फक्त transaction पूर्ण झाला का नाही इतकी नाही. अनधिकृत लिस्टिंग्ज अस्तित्वात होत्याच, आणि त्यातील किमान एका लिस्टिंगमध्ये सर्व 500,000 सहभागींच्या डेटाशी संबंधित माहिती असल्याचे दिसले. स्वयंसेवी सहभागावर उभ्या असलेल्या प्रकल्पासाठी, ती मर्यादा स्वतःतच चिंताजनक आहे.

ब्रिटिश विज्ञान पायाभूत सुविधांसाठी विश्वासार्हतेचे आव्हान

UK Biobank हा population health संशोधनासाठी सर्वात शक्तिशाली संसाधनांपैकी एक राहिला आहे. या घटनेमुळे ते बदलत नाही. पण त्याने संस्था आणि सरकारवर डेटाबेसचे governance त्याच्या वैज्ञानिक महत्त्वाशी सुसंगत आहे हे दाखवण्याची जबाबदारी वाढवली आहे.

तत्काल मुद्दा platform enforcement आणि नियामक पुढील कारवाई असू शकतो. दीर्घकालीन मुद्दा विश्वास आहे. इतक्या महत्त्वाच्या डेटाबेसभोवती जर जनतेला वारंवार exposure ची चिंता दिसत राहिली, तर केवळ आश्वासने पुरेशी राहणार नाहीत. त्याऐवजी जे महत्त्वाचे ठरेल ते म्हणजे सुरक्षा पद्धती, access controls, auditing, आणि accountability मजबूत केल्याचे स्पष्ट पुरावे.

ब्रिटनने वर्षानुवर्षे डेटा-समृद्ध जैववैद्यकीय संशोधनाला एक strategic national advantage म्हणून मांडले आहे. तो फायदा टिकवण्यासाठी, वैज्ञानिक महत्त्वाकांक्षा आणि data stewardship यांना समान गंभीर जबाबदाऱ्या मानल्या जात आहेत, हे सिद्ध करावे लागेल.

हा लेख The Guardian च्या वार्तांकनावर आधारित आहे. मूळ लेख वाचा.

Originally published on theguardian.com