Caché dans la chaîne d'approvisionnement

Une enquête de Rest of World a révélé que les travailleurs indépendants à travers l'Afrique qui ont été embauchés par la plateforme d'étiquetage de données Appen pour effectuer des tâches d'annotation courantes — identifier des objets dans les images, transcrire de l'audio, catégoriser du texte — contribuaient involontairement à des systèmes d'IA utilisés par l'armée américaine. Les travailleurs, dont beaucoup ont été payés quelques dollars par heure, ignoraient que leur travail alimentait les applications de défense et de renseignement.

Cette révélation expose un aspect troublant de la chaîne d'approvisionnement de l'IA : la vaste main-d'œuvre d'annotateurs humains dont le travail est essentiel pour entraîner les systèmes d'apprentissage automatique est souvent délibérément tenue dans l'ignorance quant à la façon dont leur travail est finalement utilisé. Le fossé entre les personnes qui étiquettent les données et les organisations qui déploient les systèmes d'IA qui en résultent soulève des questions éthiques sérieuses concernant le consentement éclairé, les pratiques de travail et l'infrastructure humaine cachée de la technologie militaire.

Comment fonctionne l'étiquetage des données pour l'armée

Les systèmes d'IA modernes, en particulier ceux utilisés pour la reconnaissance d'images, le traitement du langage naturel et l'aide à la décision, nécessitent d'énormes quantités de données d'entraînement étiquetées. Quelqu'un doit examiner des milliers d'images satellites et dessiner des boîtes autour des véhicules. Quelqu'un doit écouter des heures d'audio et transcrire ce qu'il entend. Quelqu'un doit lire du texte et le catégoriser par sujet, sentiment ou intention.

Ce travail est généralement externalisé par une chaîne d'intermédiaires. Un entrepreneur en défense pourrait embaucher une entreprise technologique pour développer un système d'IA. Cette entreprise pourrait sous-traiter l'étiquetage des données à une plateforme comme Appen, qui distribue ensuite le travail à des travailleurs indépendants du monde entier, dont beaucoup se trouvent dans des pays où les coûts du travail sont une fraction de ce qu'ils sont aux États-Unis ou en Europe.

À chaque étape de cette chaîne, l'utilisation finale ultime des données devient plus obscurcie. Les travailleurs indépendants au bas de la pyramide voient des tâches individuelles — étiqueter cette image, transcrire ce clip audio — sans contexte sur le système plus large qu'ils aident à construire. Les conditions d'utilisation et les accords de non-divulgation d'Appen interdisent souvent aux travailleurs de connaître l'identité du client final, sans parler de l'application que leur travail supporte.

Ce que les travailleurs étiquetaient

L'enquête a révélé que les travailleurs indépendants africains effectuaient une variété de tâches d'annotation qui s'alignent avec les applications d'IA militaires connues. Celles-ci comprenaient l'identification et la classification d'objets dans des images aériennes et satellites — une capacité centrale pour les systèmes de surveillance et de ciblage militaires. Les travailleurs ont également participé à la transcription et à la catégorisation des données de communication, et à l'étiquetage des caractéristiques géospatiales dans les images de cartographie.

Aucun des travailleurs interrogés par Rest of World n'a été informé que son travail était lié à des applications militaires ou de renseignement. Plusieurs ont exprimé le choc et le malaise en apprenant l'utilisation ultime de leur travail, certains disant qu'ils n'auraient pas accepté le travail s'ils l'avaient su.

Les implications éthiques sont particulièrement pertinentes compte tenu du contexte géopolitique. Certains des travailleurs sont basés dans des pays qui ont connu des opérations militaires américaines ou qui entretiennent des relations compliquées avec la politique étrangère américaine. L'idée que leur travail pourrait contribuer à des capacités militaires dirigées vers des régions similaires à leurs propres communautés était profondément troublante pour plusieurs des travailleurs interrogés.

  • Les travailleurs indépendants en Afrique ont été embauchés par Appen pour étiqueter les données qui alimentaient les systèmes d'IA militaires américains
  • Les travailleurs ont été payés une fraction des salaires occidentaux et n'avaient aucune connaissance de l'utilisation militaire finale
  • La chaîne de sous-traitance multicouche obscurcit délibérément l'application ultime du travail d'étiquetage des données
  • Les travailleurs ont exprimé le choc et le malaise en apprenant comment leur travail était utilisé

Le rôle d'Appen dans la chaîne d'approvisionnement de l'IA

Appen, une entreprise australienne qui a été l'une des plus grandes plateformes d'annotation de données au monde, a longtemps servi d'intermédiaire critique dans la chaîne d'approvisionnement de l'IA. L'entreprise avait une main-d'œuvre mondiale de plus d'un million d'entrepreneurs à son apogée, fournissant des données étiquetées aux entreprises technologiques, aux agences gouvernementales et aux entrepreneurs en défense.

L'entreprise a confronté des difficultés financières ces dernières années à mesure que l'industrie de l'étiquetage des données est devenue plus compétitive et que certaines entreprises d'IA ont rapatrié le travail d'annotation. Mais ses contrats historiques avec les clients de la défense et du renseignement signifient que d'importantes quantités de données étiquetées par sa main-d'œuvre mondiale ont déjà été incorporées dans les systèmes d'IA militaires.

Les défenseurs d'Appen soutiennent que l'entreprise opère dans le cadre de la loi et que ses contrats avec les clients incluent des dispositions appropriées pour la sécurité des données et la confidentialité. Les critiques rétorquent que les dispositions de confidentialité qui empêchent les travailleurs de savoir sur quoi ils travaillent sont intrinsèquement exploitantes, particulièrement lorsque le travail implique des applications militaires que les travailleurs pourraient trouver moralement répréhensibles.

L'éthique du travail invisible

L'enquête souligne un défi éthique plus large dans l'industrie de l'IA. Le secteur technologique a été remarquablement efficace pour rendre invisible le travail humain derrière les systèmes d'IA. Lorsqu'un système d'IA militaire identifie correctement une cible dans une image satellite, le crédit va à l'algorithme et aux ingénieurs qui l'ont conçu. Les milliers d'annotateurs humains dont le travail a rendu le système possible sont rarement reconnus, et encore moins consultés sur la façon dont le système est utilisé.

Les défenseurs des droits du travail ont appelé à une plus grande transparence dans la chaîne d'approvisionnement de l'IA, y compris des exigences selon lesquelles les travailleurs d'étiquetage de données soient informés de la catégorie générale d'application que leur travail supporte. Certains ont proposé des schémas de certification, similaires aux labels de commerce équitable, qui vérifieraient que les données d'entraînement de l'IA ont été produites dans des conditions de travail éthiques avec le consentement éclairé des travailleurs.

Implications pour la gouvernance de l'IA

La révélation a également des implications pour le débat international croissant sur la gouvernance de l'IA. À mesure que les gouvernements développent des cadres pour réglementer les systèmes d'IA, la question de la façon dont les données d'entraînement sont sourcées et étiquetées a reçu relativement peu d'attention par rapport à des questions comme le biais algorithmique et les tests de sécurité.

L'utilisation de travail étranger involontaire pour entraîner les systèmes d'IA militaires pourrait devenir un point sensible dans les négociations internationales sur la gouvernance de l'IA, en particulier à mesure que les pays en développement poussent pour une plus grande reconnaissance de leur rôle dans — et un plus grand bénéfice de — l'économie mondiale de l'IA. Si les travailleurs qui rendent l'IA possible ne savent même pas ce qu'ils construisent, la fondation de l'industrie de l'IA repose sur une asymétrie morale troublante.

Pour les travailleurs indépendants en Afrique qui ont découvert la véritable nature de leur travail, l'expérience a cristallisé une prise de conscience croissante que l'économie mondiale de l'IA dépend de leur travail mais ne se sent pas obligée de les inclure dans les décisions sur la façon dont ce travail est utilisé.

Cet article est basé sur le reportage de Rest of World. Lire l'article original.