Abriendo las Bóvedas
El Departamento de Defensa de EE.UU. está planeando permitir que empresas de inteligencia artificial entrenen sus modelos con datos militares clasificados, según un oficial de defensa citado por MIT Technology Review. La iniciativa, si se implementa, representaría una de las expansiones más significativas del acceso de AI a información gubernamental sensible en la historia de EE.UU. — y una apuesta deliberada de que las ventajas de capacidad ganadas superan los riesgos de exponer datos clasificados a sistemas comerciales de AI y las empresas que los desarrollan.
El oficial describió un marco en desarrollo que permitiría a empresas de AI examinadas acceder a conjuntos de datos clasificados en entornos de computación seguros, utilizando esos datos para entrenar y ajustar modelos para aplicaciones de defensa específicas. Los datos clasificados permanecerían dentro de infraestructura controlada por el gobierno — las empresas de AI no llevarían los datos fuera del sitio — pero su personal y canalizaciones de entrenamiento de modelos serían otorgados acceso a información normalmente restringida a personal con permisos de seguridad apropiados.
Por Qué el Pentágono Quiere Esto
La razón militar es directa: las aplicaciones de AI más valiosas para la defensa requieren acceso al tipo de datos que solo las fuerzas militares poseen. Entrenar un modelo de AI para reconocer hardware militar específico en imágenes de satélite, analizar inteligencia de señales, sintetizar inteligencia de fuentes clasificadas, u optimizar logística para operaciones clasificadas requiere datos de entrenamiento que reflejen esos dominios específicos — y esos datos, por definición, son clasificados.
Los modelos de AI comerciales entrenados en datos disponibles públicamente son útiles para muchas aplicaciones de defensa pero fundamentalmente limitados en los dominios donde la clasificación crea las brechas de capacidad más importantes. Un modelo entrenado en imágenes de satélite de código abierto nunca igualará el rendimiento de uno entrenado en inteligencia aérea clasificada. El interés del Pentágono en datos de entrenamiento clasificados refleja un reconocimiento de que el desarrollo comercial de AI no puede cerrar esas brechas sin acceso a datos que solo el gobierno controla.
Los Riesgos
Los riesgos asociados con este enfoque son sustanciales y abarcan varias categorías. El más obvio es la amenaza interna y la exfiltración de datos: otorgar a empresas de AI personal y sistemas acceso a datos clasificados expande la superficie para filtraciones potenciales, ya sea por robo deliberado, divulgación accidental o compromiso adversarial de infraestructura de empresas de AI.
Un segundo riesgo es la inversión de modelos y ataques de inferencia de membresía — técnicas por las cuales un adversario que tiene acceso a un modelo entrenado puede extraer información sobre los datos utilizados para entrenarlo. Si datos clasificados se utilizan para entrenar un modelo de AI, y ese modelo o sus salidas se implementan posteriormente en contextos donde los adversarios pueden interactuar con él, hay una ruta potencial para recuperar información sensible de las representaciones aprendidas del modelo.
Tercero, hay preguntas significativas sobre la postura de seguridad de las propias empresas de AI. Incluso los desarrolladores de AI más grandes han tenido incidentes de seguridad, y sus entornos de desarrollo no están construidos con los estándares requeridos para manejar información de seguridad nacional clasificada. Cerrar esa brecha añade costo y complejidad que podría ralentizar el desarrollo de capacidad que la iniciativa está diseñada para acelerar.
El Imperativo Competitivo
El impulso viene en un contexto de urgencia genuina. El programa de AI militar de China está avanzando rápidamente, y el desarrollo de AI respaldado por el estado chino puede acceder a datos de PLA sin las barreras legales e institucionales que separan empresas comerciales de sistemas clasificados de EE.UU. El Pentágono ve la brecha entre capacidad comercial de AI y capacidad de AI entrenada con datos clasificados como una vulnerabilidad estratégica — una que un marco de intercambio de datos más permisivo está diseñado para abordar.
La iniciativa está en desarrollo en lugar de implementación, y su forma final dependerá de revisiones legales, decisiones de autoridades de clasificación y negociación de acuerdos de seguridad con empresas participantes. Pero la dirección del viaje es clara: el Pentágono se está moviendo hacia un modelo en el cual el límite entre datos militares clasificados y desarrollo comercial de AI se vuelve más permeable en servicio de mantener la superioridad de AI sobre competidores estratégicos.
Este artículo se basa en reportaje de MIT Technology Review. Lee el artículo original.
Originally published on technologyreview.com




