Pentágono planea permitir que empresas de IA entrenen modelos con datos clasificados

Una nueva frontera en la defensa de IA

El Departamento de Defensa de EE.UU. está desarrollando planes para permitir que empresas comerciales de inteligencia artificial entrenen sus modelos con datos militares clasificados dentro de entornos seguros especialmente diseñados. Hasta ahora, las empresas de IA con contratos del Pentágono podían acceder a información clasificada para hacer inferencias con modelos existentes — pero no podían usar esos datos como material de entrenamiento para mejorar y adaptar los modelos. Esa distinción está a punto de cambiar.

El movimiento representa una escalada significativa de la integración entre capacidades comerciales de IA y el dominio clasificado de la seguridad nacional de EE.UU. Si se implementa, permitiría que los sistemas de IA desplegados por el ejército se personalicen con datos operacionales reales, produciendo modelos específicamente adaptados a las tareas de análisis de inteligencia, logística, planificación y orientación que el Pentágono realmente realiza.

Por qué el entrenamiento en datos clasificados es importante

La diferencia entre usar un modelo de IA de propósito general en entradas clasificadas y entrenar un modelo con datos clasificados es sustancial. Un modelo de propósito general entrenado en datos públicos de Internet puede funcionar adecuadamente en muchas tareas pero carecerá del vocabulario especializado, la comprensión contextual y el razonamiento específico del dominio que proviene del entrenamiento en los tipos de datos reales que un sistema encontrará en el despliegue.

Un modelo entrenado en informes militares clasificados, análisis de imágenes satelitales, inteligencia de señales y datos logísticos desarrollaría capacidades específicamente afinadas para esos dominios. Entendería la estructura de los formatos de informes militares, el vocabulario de las evaluaciones de amenazas y los patrones en productos de inteligencia — todo lo cual es invisible para los modelos entrenados exclusivamente en datos públicos.

Este tipo de ajuste fino específico del dominio es práctica estándar en el despliegue comercial de IA. Un modelo ajustado en registros médicos funciona mejor en tareas clínicas que un modelo de propósito general. El Pentágono busca la misma ventaja en el dominio de la seguridad nacional.

Create, edit and star in videos with two Google Vids updates

Google Vids añade Gemini Omni y avatares personales

Google está ampliando la creación de video con IA en Workspace con generación y edición de clips basadas en indicaciones, además de avatares personalizados creados a partir de una selfie y una grabación de voz.

Read article

El enfoque del enclave seguro

El mecanismo propuesto implica crear entornos de computación físicamente seguros — a menudo llamados enclaves — donde los datos clasificados pueden traerse a la infraestructura de entrenamiento de IA en lugar de lo contrario. Los ingenieros de empresas de IA y sus sistemas operarían dentro de estas instalaciones bajo condiciones de supervisión que satisfacen requisitos de clasificación.

Esto es técnicamente y logísticamente complejo. El entrenamiento de grandes modelos de IA requiere infraestructura computacional masiva, y replicar esa infraestructura en los niveles de seguridad requeridos para manejar datos de alto secreto implica tanto la adquisición de hardware como el establecimiento de instalaciones que cumplan con estándares físicos y de ciberseguridad rigurosos.

Empresas de IA ya desplegadas por el Pentágono

El contexto para este anuncio es una expansión más amplia de asociaciones de IA entre el Pentágono y grandes desarrolladores comerciales de IA. El Oficial Jefe de Tecnología del Pentágono, Emil Michael, confirmó esta semana que los sistemas de OpenAI ya han sido desplegados dentro del Departamento en las últimas semanas, con Google Gemini esperado para seguir pronto.

Ya hemos desplegado OpenAI en las últimas semanas, y vamos a desplegar a los otros aquí, comenzando con Gemini, dijo Michael, confirmando un ritmo de integración de IA que hubiera sido difícil de imaginar hace unos años. El cambio de programas piloto cautelosos a despliegue operacional señala que el Pentágono ve los modelos de lenguaje grandes comerciales como herramientas genuinamente útiles en lugar de curiosidades experimentales.

El plan para permitir el entrenamiento en datos clasificados se basa en esta base de despliegue. Las empresas cuyos modelos ya están operando dentro de sistemas DoD son candidatos naturales para desarrollar versiones más especializadas entrenadas con los datos que esos sistemas encuentran.

Preguntas de política y supervisión

El plan plantea preguntas significativas de supervisión que el Departamento necesitará abordar. ¿Quién controla los datos de entrenamiento y los modelos resultantes? ¿Qué sucede con los sistemas de IA después de que se complete el entrenamiento clasificado — permanecen dentro de sistemas gubernamentales, o elementos de lo que el modelo aprendió pueden migrar hacia versiones comerciales? ¿Cómo se examinan y supervisan los ingenieros de empresas de IA dentro de instalaciones seguras?

El Congreso, que ha estado cada vez más atento tanto al desarrollo de IA como a la política de tecnología de seguridad nacional, probablemente escrutinizará la iniciativa. La combinación de IA comercial y datos de seguridad nacional clasificados es territorio sensible que toca preocupaciones sobre seguridad de datos, acceso corporativo a información gubernamental y estructuras de rendición de cuentas que rigen sistemas de IA militares.

El hecho de que el Pentágono esté avanzando con la planificación señala confianza en que estos problemas pueden manejarse, y que los beneficios operacionales de la IA adaptada al dominio se consideran suficientemente convincentes para justificar el esfuerzo de construir la infraestructura necesaria y el marco de supervisión.

Este artículo se basa en reportes de The Decoder. Lee el artículo original.

Originally published on the-decoder.com

El Pentágono planea permitir que empresas de IA entrenen modelos con datos clasificados