L'Ouverture des Coffres

Le Département de la Défense des États-Unis prévoit de permettre aux entreprises d'intelligence artificielle d'entraîner leurs modèles sur des données militaires classifiées, selon un officier de défense cité par MIT Technology Review. Cette initiative, si elle est mise en œuvre, représenterait l'une des expansions les plus significatives de l'accès de l'IA aux informations gouvernementales sensibles de l'histoire des États-Unis — et un pari délibéré selon lequel les avantages de capacité gagnés dépassent les risques d'exposition des données classifiées aux systèmes commerciaux d'IA et aux entreprises qui les construisent.

L'officier a décrit un cadre en cours de développement qui permettrait aux entreprises d'IA examinées d'accéder à des ensembles de données classifiées dans des environnements informatiques sécurisés, en utilisant ces données pour entraîner et affiner les modèles pour des applications de défense spécifiques. Les données classifiées resteraient au sein de l'infrastructure contrôlée par le gouvernement — les entreprises d'IA n'emmèneraient pas les données hors site — mais leur personnel et leurs pipelines d'entraînement de modèles seraient autorisés à accéder à des informations normalement restreintes au personnel possédant les autorisations de sécurité appropriées.

Pourquoi le Pentagone Veut Ceci

La raison militaire est simple et directe : les applications d'IA les plus précieuses pour la défense nécessitent l'accès au type de données que seules les forces militaires possèdent. Entraîner un modèle d'IA pour reconnaître des équipements militaires spécifiques dans des images satellites, analyser l'intelligence des signaux, synthétiser l'intelligence à partir de sources classifiées, ou optimiser la logistique pour les opérations classifiées nécessite des données d'entraînement qui reflètent ces domaines spécifiques — et ces données sont, par définition, classifiées.

Les modèles d'IA commerciaux entraînés sur des données disponibles publiquement sont utiles pour de nombreuses applications de défense mais fondamentalement limités dans les domaines où la classification crée les plus grands écarts de capacité. Un modèle entraîné sur des images satellites open-source n'égalera jamais les performances d'un modèle entraîné sur des renseignements aériens classifiés. L'intérêt du Pentagone pour les données d'entraînement classifiées reflète la reconnaissance que le développement commercial de l'IA ne peut pas combler ces lacunes sans accès aux données que seul le gouvernement contrôle.

Les Risques

Les risques associés à cette approche sont substantiels et couvrent plusieurs catégories. Le plus évident est la menace interne et l'exfiltration de données : accorder au personnel des entreprises d'IA et aux systèmes l'accès aux données classifiées élargit la surface d'exposition pour les fuites potentielles, qu'elles soient par vol délibéré, divulgation accidentelle ou compromission adverse de l'infrastructure des entreprises d'IA.

Un deuxième risque est l'inversion de modèle et les attaques par inférence d'appartenance — des techniques par lesquelles un adversaire ayant accès à un modèle entraîné peut extraire des informations sur les données utilisées pour l'entraîner. Si des données classifiées sont utilisées pour entraîner un modèle d'IA, et que ce modèle ou ses résultats sont ensuite déployés dans des contextes où les adversaires peuvent interagir avec lui, il existe un chemin potentiel pour récupérer des informations sensibles à partir des représentations apprises du modèle.

Troisièmement, il y a des questions importantes sur la posture de sécurité des entreprises d'IA elles-mêmes. Même les plus grands développeurs d'IA ont connu des incidents de sécurité, et leurs environnements de développement ne sont pas construits aux normes requises pour traiter les informations de sécurité nationale classifiées. Combler cet écart ajoute des coûts et une complexité qui pourraient ralentir le développement de capacités que l'initiative est conçue pour accélérer.

L'Impératif Concurrentiel

L'impulsion vient dans un contexte d'urgence genuine. Le programme d'IA militaire de la China progresse rapidement, et le développement d'IA soutenu par l'État chinois peut accéder aux données de PLA sans les barrières légales et institutionnelles qui séparent les entreprises commerciales des systèmes classifiés américains. Le Pentagone considère l'écart entre la capacité commerciale d'IA et la capacité d'IA entraînée sur des données classifiées comme une vulnérabilité stratégique — que un cadre de partage de données plus permissif est conçu pour aborder.

L'initiative est en phase de développement plutôt que de mise en œuvre, et sa forme finale dépendra des examens juridiques, des décisions des autorités de classification et de la négociation d'accords de sécurité avec les entreprises participantes. Mais la direction est claire : le Pentagone se dirige vers un modèle dans lequel la limite entre les données militaires classifiées et le développement commercial de l'IA devient plus perméable au service de maintenir la supériorité de l'IA sur les concurrents stratégiques.

Cet article est basé sur un reportage de MIT Technology Review. Lire l'article original.

Originally published on technologyreview.com