Meta utilisera les frappes et clics des employés pour entraîner l’IA

Meta se tourne vers l’interne pour une nouvelle source de données d’entraînement pour l’IA

Meta affirme qu’elle collectera les mouvements de souris, les clics de boutons et d’autres saisies de ses propres employés sur certaines applications dans le cadre d’un effort visant à entraîner des modèles d’intelligence artificielle. L’explication de l’entreprise est opérationnelle: si elle veut construire des agents capables d’aider les gens à accomplir des tâches quotidiennes sur ordinateur, les modèles doivent disposer d’exemples montrant comment les humains utilisent réellement les interfaces, naviguent dans les menus et effectuent des actions dans différents environnements logiciels.

À première vue, ce raisonnement est facile à comprendre. Un système destiné à agir sur un ordinateur a besoin de traces comportementales qui montrent non seulement ce qu’est une tâche, mais aussi comment une personne l’accomplit. Pourtant, cette démarche est notable car elle met en lumière un changement plus large dans l’industrie de l’IA. Les données d’entraînement ne se limitent plus au texte public, aux médias sous licence ou aux ensembles de données étiquetés classiques. De plus en plus, la matière première du développement des modèles inclut les traces du travail humain lui-même.

Ce que Meta dit collecter

Selon le texte source, Meta a indiqué qu’elle lançait un outil interne capable de capturer « ces types d’entrées » sur certaines applications. L’entreprise a décrit l’objectif comme étant l’entraînement de modèles pour des agents capables d’aider les gens à accomplir des tâches courantes sur ordinateur. Meta a également déclaré que des garanties sont en place pour protéger les contenus sensibles et que les données ne sont utilisées à aucune autre fin.

Cette formulation compte. La déclaration met l’accent sur les données d’interaction plutôt que sur une surveillance plus large, mais elle décrit tout de même un système qui transforme le comportement routinier au travail en matière d’entraînement. Les clics, les mouvements du curseur et les schémas de navigation peuvent sembler modestes pris isolément, mais ensemble ils créent une carte riche de la manière dont le travail s’effectue sur les systèmes numériques.

Ce type de données peut être précieux parce qu’il capture la couche procédurale de l’informatique. Les grands modèles de langage peuvent déjà générer du texte sur des tâches logicielles. Ce qui leur manque souvent, ce sont des preuves comportementales concrètes des séquences suivies par les humains dans de vraies interfaces. L’usage interne par les employés fournit précisément cela.

Two drones, one yellow, one grey, almost identical otherwise.

La FCC se dirige vers une interdiction rétroactive visant des sociétés écrans soupçonnées de DJI

Le régulateur américain des télécommunications prépare un nouvel outil d’application contre des entreprises qui, selon lui, auraient dissimulé des produits DJI pour les maintenir sur le marché américain.

Read article

Pourquoi l’industrie de l’IA recherche de nouvelles entrées

L’article situe la décision de Meta dans le contexte d’une course plus large aux données d’entraînement. À mesure que les systèmes d’IA deviennent plus capables, les entreprises recherchent des sources plus spécifiques aux tâches, plus actuelles et plus étroitement liées aux comportements du monde réel. Pour des systèmes destinés à fonctionner comme des agents numériques, le texte seul ne suffit pas. Les développeurs ont besoin d’enregistrements d’interactions avec des interfaces graphiques, des formulaires, des boutons, des menus déroulants et des flux de travail qui traversent plusieurs applications.

Cela aide à comprendre pourquoi l’activité interne des entreprises devient attrayante. Les entreprises contiennent déjà de grands volumes de comportement opérationnel: notes de réunion, journaux d’assistance, historiques de projets, schémas d’utilisation de logiciels et archives de communications. Le texte source note un autre exemple récent dans lequel d’anciennes startups auraient été exploitées pour leurs communications internes, comme des archives Slack et des tickets Jira, pouvant être réutilisées comme carburant pour l’IA. Le schéma est clair. Des informations créées autrefois pour collaborer sont de plus en plus réévaluées comme entrée pour les modèles.

L’approche de Meta diffère en ce qu’elle ne se contente pas de récupérer des archives historiques. Elle capture des données d’interaction en direct auprès des employés pour soutenir une ambition produit précise.

L’objectif stratégique: de meilleurs agents qui utilisent l’ordinateur

La déclaration de Meta pointe directement vers la catégorie de produit en jeu: des agents d’IA capables d’aider les utilisateurs à accomplir des tâches quotidiennes sur ordinateur. C’est un front important du secteur. La différence entre un chatbot capable d’expliquer un flux de travail et un agent capable de l’exécuter est immense. Pour franchir cet écart, les entreprises ont besoin de modèles qui comprennent non seulement le langage, mais aussi le comportement des interfaces.

L’entraînement sur les mouvements de souris et les clics pourrait aider les modèles à apprendre des séquences d’actions courantes, des possibilités offertes par l’interface et les points de décision que les humains rencontrent lorsqu’ils travaillent dans des applications. Autrement dit, l’entreprise semble rassembler le substrat comportemental nécessaire à une automatisation moins abstraite et plus opérationnelle.

C’est aussi pourquoi cette démarche dépasse le simple ajout d’un outil interne. Elle montre comment les entreprises s’attendent à ce que la prochaine génération de systèmes d’IA soit compétitive: non seulement sur la qualité de la conversation, mais sur sa capacité à agir dans des environnements logiciels.

$A fractured image of a person speaking into a microphone.$

Sony élargit son bras de fer avec Udio avec une nouvelle plainte sur 30 000 chansons

Sony Music a déposé une nouvelle plainte accusant Udio d’avoir violé les droits de plus de 30 000 chansons, ce qui intensifie l’un des contentieux les plus importants autour du droit d’auteur appliqué à la musique générée par IA.

Read article

Le problème de la vie privée et de la gouvernance

La même logique qui rend ces données utiles les rend aussi sensibles. Les interactions sur le lieu de travail ne sont pas des résidus neutres. Elles peuvent révéler des habitudes, des priorités, des erreurs, des modèles d’accès et, dans certains cas, des aperçus d’informations sensibles. Même si Meta limite la collecte à certaines applications et dit avoir mis en place des garanties, la décision soulève une question de gouvernance qui ne se limitera pas à une seule entreprise: quelle part de l’activité ordinaire des employés peut être réutilisée pour entraîner des modèles avant que le suivi en milieu de travail et le développement produit deviennent difficiles à distinguer?

La question n’est pas seulement de savoir si du contenu privé est exposé. Elle concerne aussi le consentement, le périmètre et le précédent. Une fois que le comportement des utilisateurs à l’intérieur des systèmes d’entreprise est traité comme matière d’entraînement, les organisations pourraient subir une pression pour formaliser des règles sur les types de traces de travail pouvant être collectées, leur durée de conservation et la possibilité pour les employés d’avoir un véritable mot à dire sur leur participation. Le texte source ne répond pas à ces questions, mais il montre clairement pourquoi elles deviennent urgentes.

Un signe de l’orientation du développement de l’IA

L’outil interne de collecte de données de Meta illustre une vérité plus large sur la course actuelle à l’IA. L’industrie s’éloigne de l’époque où les progrès des modèles dépendaient surtout de l’accumulation de plus de texte à l’échelle d’internet. Les gains suivants proviendront probablement de données plus étroites, plus comportementales et plus étroitement liées à des tâches spécifiques. Cela modifie à la fois la boîte à outils technique et le contrat social autour de l’usage des données.

Pour Meta, le bénéfice à court terme pourrait être un meilleur entraînement pour des systèmes capables de faire fonctionner des ordinateurs plus efficacement. Pour le marché dans son ensemble, l’annonce est un signal supplémentaire que le comportement numérique quotidien est désormais requalifié en infrastructure stratégique pour l’IA.

C’est peut-être, au final, l’enseignement le plus important. L’avenir de l’entraînement de l’IA ne sera pas façonné uniquement par ce que les gens disent ou écrivent en ligne. Il dépendra aussi de la manière dont ils naviguent dans les logiciels, prennent des décisions à l’écran et accomplissent les routines du travail numérique. Meta a rendu ce basculement inhabituellement explicite. Le reste du secteur l’observera probablement de près, à la fois pour les avantages techniques et pour les risques de gouvernance qu’il met au jour.

Cet article est basé sur un reportage de TechCrunch. Lire l’article original.

Originally published on techcrunch.com

Le projet de Meta de capturer les clics et frappes de ses employés montre jusqu’où s’étend la quête de données pour l’IA