वॉल्ट खोलना

यूएस रक्षा विभाग कृत्रिम बुद्धिमत्ता कंपनियों को वर्गीकृत सैन्य डेटा पर अपने मॉडल प्रशिक्षित करने की अनुमति देने की योजना बना रहा है, MIT Technology Review द्वारा उद्धृत एक रक्षा अधिकारी के अनुसार। यह पहल, यदि लागू की जाती है, तो संवेदनशील सरकारी जानकारी तक AI पहुंच का सबसे महत्वपूर्ण विस्तार होगा और वाणिज्यिक AI सिस्टम और उन्हें बनाने वाली कंपनियों को वर्गीकृत डेटा उजागर करने के जोखिम से लाभ प्राप्त करने का एक जानबूझकर जुआ होगा।

अधिकारी ने एक विकासमान ढांचे का वर्णन किया जो जांच की गई AI कंपनियों को सुरक्षित कंप्यूटिंग वातावरण में वर्गीकृत डेटासेट तक पहुंचने की अनुमति देगा, विशिष्ट रक्षा अनुप्रयोगों के लिए मॉडल को प्रशिक्षित और सूक्ष्म-ट्यून करने के लिए उस डेटा का उपयोग करेगा। वर्गीकृत डेटा सरकार-नियंत्रित बुनियादी ढांचे के भीतर रहेगा — AI कंपनियां डेटा को साइट से बाहर नहीं ले जाएंगी — लेकिन उनकी कर्मचारी और उनके मॉडल प्रशिक्षण पाइपलाइन को जानकारी तक पहुंच प्रदान की जाएगी जो आमतौर पर उपयुक्त सुरक्षा निकासी वाले कर्मचारियों तक सीमित है।

पेंटागन को यह क्यों चाहिए

सैन्य तर्क सीधा है: रक्षा के लिए सबसे मूल्यवान AI अनुप्रयोगों को ऐसे डेटा तक पहुंच की आवश्यकता है जो केवल सेना के पास है। AI मॉडल को उपग्रह कल्पना में विशिष्ट सैन्य हार्डवेयर को पहचानने के लिए, संकेतों खुफिया का विश्लेषण करने के लिए, वर्गीकृत स्रोतों से खुफिया को संश्लेषित करने के लिए, या वर्गीकृत संचालन के लिए रसद को अनुकूलित करने के लिए प्रशिक्षित करने के लिए प्रशिक्षण डेटा की आवश्यकता है जो उन विशिष्ट डोमेन को प्रतिबिंबित करता है — और वह डेटा, परिभाषा के अनुसार, वर्गीकृत है।

सार्वजनिक रूप से उपलब्ध डेटा पर प्रशिक्षित वाणिज्यिक AI मॉडल कई रक्षा अनुप्रयोगों के लिए उपयोगी हैं लेकिन मौलिक रूप से उन डोमेन में सीमित हैं जहां वर्गीकरण सबसे महत्वपूर्ण क्षमता अंतराल बनाता है। खुला स्रोत उपग्रह कल्पना पर प्रशिक्षित मॉडल कभी भी वर्गीकृत ओवरहेड खुफिया पर प्रशिक्षित मॉडल के प्रदर्शन से मेल नहीं खाएगा। पेंटागन की वर्गीकृत प्रशिक्षण डेटा में रुचि एक स्वीकृति को दर्शाती है कि वाणिज्यिक AI विकास उन अंतराल को बंद नहीं कर सकता है जब तक कि डेटा तक पहुंच न हो जो केवल सरकार नियंत्रित करती है।

जोखिम

इस दृष्टिकोण से जुड़े जोखिम पर्याप्त हैं और कई श्रेणियों में फैले हैं। सबसे स्पष्ट अंदरूनी खतरा और डेटा निकालना है: AI कंपनी कर्मचारियों और प्रणालियों को वर्गीकृत डेटा तक पहुंच देना संभावित लीक के लिए सतह क्षेत्र का विस्तार करता है, चाहे वह जानबूझकर चोरी, आकस्मिक प्रकटीकरण, या AI कंपनी बुनियादी ढांचे के विरोधी समझौते के माध्यम से हो।

दूसरा जोखिम मॉडल इनवर्जन और सदस्यता अनुमान हमले हैं — तकनीकें जिनके द्वारा एक प्रतिद्वंद्वी जो प्रशिक्षित मॉडल तक पहुंच सकता है, उस डेटा के बारे में जानकारी निकाल सकता है जो इसे प्रशिक्षित करने के लिए उपयोग किया गया था। यदि वर्गीकृत डेटा AI मॉडल को प्रशिक्षित करने के लिए उपयोग किया जाता है, और वह मॉडल या इसके आउटपुट बाद में ऐसे संदर्भों में तैनात किए जाते हैं जहां विरोधी इसके साथ बातचीत कर सकते हैं, तो मॉडल के सीखे गए प्रतिनिधित्व से संवेदनशील जानकारी पुनः प्राप्त करने के लिए एक संभावित मार्ग है।

तीसरा, AI कंपनियों के स्वयं के सुरक्षा मुद्रा के बारे में महत्वपूर्ण सवाल हैं। यहां तक कि सबसे बड़ी AI कंपनियों के पास सुरक्षा घटनाएं हुई हैं, और उनके विकास वातावरण को वर्गीकृत राष्ट्रीय सुरक्षा जानकारी को संभालने के लिए आवश्यक मानकों के लिए निर्मित नहीं किया गया है। इस अंतर को पाटना लागत और जटिलता जोड़ता है जो बहुत ही क्षमता विकास को धीमा कर सकता है जो पहल को त्वरित करने के लिए डिज़ाइन किया गया है।

प्रतिस्पर्धी अनिवार्यता

यह पुश वास्तविक जरूरत के संदर्भ में आता है। चीन का सैन्य AI कार्यक्रम तेजी से आगे बढ़ रहा है, और चीनी सरकार द्वारा समर्थित AI विकास PLA डेटा तक पहुंच सकता है कानूनी और संस्थागत बाधाओं के बिना जो वाणिज्यिक कंपनियों को यूएस वर्गीकृत प्रणाली से अलग करते हैं। पेंटागन वाणिज्यिक AI क्षमता और वर्गीकृत-डेटा-प्रशिक्षित AI क्षमता के बीच अंतर को एक रणनीतिक कमजोरी के रूप में देखता है — एक जो अधिक अनुमेय डेटा-साझाकरण ढांचे का समाधान करना है।

पहल विकास में है न कि कार्यान्वयन में, और इसका अंतिम रूप कानूनी समीक्षा, वर्गीकरण प्राधिकरण निर्णय, और भाग लेने वाली कंपनियों के साथ सुरक्षा समझौतों के वार्ता पर निर्भर करेगा। लेकिन यात्रा की दिशा स्पष्ट है: पेंटागन एक ऐसे मॉडल की ओर बढ़ रहा है जिसमें वर्गीकृत सैन्य डेटा और वाणिज्यिक AI विकास के बीच सीमा सामरिक प्रतियोगियों पर AI श्रेष्ठता बनाए रखने की सेवा में अधिक पारगम्य हो जाती है।

यह लेख MIT Technology Review द्वारा रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें

Originally published on technologyreview.com