derrière le boom des intelligences artificielles génératives, le travail caché des petites mains de l’IA

Ray Richard

il y a 8 mois

derrière le boom des intelligences artificielles génératives, le travail caché des petites mains de l’IA

Créer des algorithmes comme ChatGPT ou Midjourney nécessite des quantités colossales de données, analysées par des humains. Des « annotateurs » indispensables mais souvent précaires, mal payés et tenus dans l’ombre.

« Des descriptions graphiques de viols, d’inceste, de nécrophilie… C’était comme ça tous les jours. » En 2021, Mophat Okinyi doit relire chaque jour plusieurs centaines de textes fournis à la société de traitement de données Sama par un client inconnu, pour entraîner un modèle d’intelligence artificielle (IA). L’objectif : indiquer au logiciel ce qui pose problème dans ces textes, pour qu’il ne le reproduise pas.

Un travail rémunéré à 21 000 shillings kenyans par mois (environ 150 euros) pour des employés subalternes dont Mophat contrôlait l’activité. Cela lui a laissé des traces durables. « Aujourd’hui encore, cela affecte mes relations avec ma famille, mes proches », explique l’analyste qualité kenyan. La mission qu’il décrit rappelle l’horreur à laquelle sont souvent confrontés les modérateurs des réseaux sociaux et a en fait répondu, comme il le découvrira plus tard, à un ordre de la start-up à la pointe de l’IA. origine de ChatGPT : OpenAI.

Le cas de Mophat Okinyi, extrême par certains aspects, n’est pas non plus un exemple isolé, car derrière les grands discours de la révolution technique se cache une masse de travailleurs invisibles dont les rangs se comptent par centaines de millions, selon les estimations. « Nous ne créons pas du tout des programmes qui se passent des humainsrésume Antonio Casilli, professeur à l’Institut polytechnique de Paris. L’IA nécessite une quantité énorme et absolument essentielle de travail humain tout au long de la chaîne de production.

La majorité de cette masse humaine est très loin des grands patrons ou des ingénieurs de renom. Elle est constituée d’une armada de travailleurs anonymes répartis à travers le monde, du Venezuela à Madagascar, en passant par les camps de réfugiés au Liban et les prisons finlandaises. Les petites mains qui construisent l’avenir clic après clic, souvent dans le secret bien gardé et la précarité.

Cliquez encore et encore

Le prix de cette modernité ? Aux Philippines, entre 1,50 et 3 dollars par « tâche ». C’est ce que la plateforme de travailleurs indépendants Remotasks paie en moyenne à Eduardo* pour placer, clic par clic, pixel par pixel, les contours qui délimitent un panneau routier sur une image. Puis un véhicule. Puis un buisson. Une « tâche » qui lui prend généralement une heure ou moins et qu’il répète inlassablement, huit heures par jour, six jours par semaine. Ces images serviront ensuite à entraîner des algorithmes d’analyse vidéo, par exemple pour les voitures autonomes ou la surveillance algorithmique. « C’est un travail intéressant. », assure à franceinfo le jeune Philippin, qui travaille sur la plateforme depuis un peu plus de trois ans. Tout le monde ne sera pas d’accord, mais sans cela, l’appareil photo de votre smartphone aurait du mal à identifier un visage, et la conduite semi-autonome de Tesla serait encore un rêve de science-fiction. Et vous-même y avez déjà contribué.

Que ce soit en laissant un « j’aime » sur Facebook ou en identifiant des images contenant une voiture lors d’un test captcha, vos retours contribuent à entraîner gratuitement des algorithmes depuis des années. Mais pour créer les IA qui ont émerveillé le monde ces derniers mois, comme ChatGPT ou Midjourney, il faut des milliards d’exemples. Des données qui doivent souvent être « annotées », autrement dit accompagnées de commentaires, pour que la machine reproduise les catégories de l’analyse humaine : faire comprendre que « cette pile de pixels est un enfant », que « cette phrase est fausse » ou que « Cet élément évoque un comportement illégal et ne doit pas être reproduit ».

Et la formation ne s’arrête jamais. « C’est un peu comme les athlètescompare Antonio Casilli. Il faut constamment les former, les adapter, les vérifier. ». Il s’agit d’évaluer les réponses, en soumettant à l’IA des exemples toujours plus précis ou adaptés au nouveau contexte culturel. Autant de tâches qu’il est actuellement impossible d’automatiser.

« Ce n’est pas assez, mais c’est déjà quelque chose »

Astro* fait partie de ces nouveaux « AI trainers ». L’entrepreneur tanzanien, qui a récemment terminé ses études de linguistique en France, exerce des tâches indépendantes à temps partiel via la plateforme Appen. « Il faut parfois isoler un visage sur une photo, dire si une image doit apparaître dans la section Souvenirs de Google Photos, si un texte est factuel ou non, créer des questions/réponses de culture générale… », explique-t-il à franceinfo. Pour ce faire, il doit suivre des règles souvent très détaillées («Cinquante pages à apprendre par cœur!»), au point de devenir parfois obscur. Le résultat : 16 dollars de l’heure sur ses projets en cours. « Plus vous travaillez, plus vous gagnez », explique l’indépendant. Mais encore faut-il être sélectionné pour participer au projet.

À l’autre extrémité du spectre, les entreprises embauchent des annotateurs en interne, notamment pour les tâches qui nécessitent une expertise spécifique. Mais pour beaucoup d’entre eux, la solution la plus rentable est souvent la sous-traitance : à des entreprises d’autres pays qui embauchent localement des annotateurs, comme Sama, ou à des plateformes comme Remotasks, Appen ou Toloka, qui transfèrent les missions à des indépendants rémunérés vers la « micro-tâche ».

« Ces travailleurs sont souvent recrutés dans des pays à faible revenu et géopolitiquement instables. »

Antonio Casilli, professeur à l’Institut Polytechnique de Paris
sur franceinfo

A ces critères, Antonio Casilli ajoute des niveaux d’éducation et d’équipement informatique importants, l’existence d’une industrie de centres d’appels ou encore des relations fortes avec une ancienne puissance coloniale. Plusieurs noms de pays reviennent souvent : les Philippines, Madagascar, le Kenya, le Venezuela, le Pakistan…

Dans ces pays, ce travail représente souvent un précieux filet de sécurité. « Ce n’est pas une source de travail fixe ou suffisante, mais c’est au moins quelque choserésume Maria*. La crise économique au Venezuela a contraint beaucoup d’entre nous à quitter le marché du travail. »raconte à franceinfo l’ingénieur industriel, qui s’est lancé sur Remotasks grâce au confinement, en 2020. Après avoir suivi une formation, elle travaille désormais trois jours par semaine sur la plateforme, à raison de 10 heures par semaine. jour.

Pour quel salaire ? « Les tâches de catégorisation confiées par Remotasks au Venezuela peuvent prendre quelques minutes seulement et être payées aussi peu que 11 cents par dollar.explique Maria. D’autres, beaucoup plus complexes, peuvent prendre huit heures ou plus, comme l’annotation de données vidéo ou lidar, et payer 10 $. » Mais tout dépend du pays et de la difficulté de la tâche. Un relatif « eldorado » qui attire, y compris parfois des mineurs qui mentent sur leur âge, à rejoindre ces plateformes de micro-tâches, raconte le site spécialisé Wired.

Précarité et dépendance

Mais ces espoirs ne suffisent pas pour en faire un métier de rêve. Même si un emploi peut être payé décemment par rapport au marché local, les travailleurs du clic déplorent souvent la différence de traitement entre les pays. « Les entreprises profitent de notre pauvreté »estime Andry*, annotateur à Madagascar, pour qui « un agent en Inde ou au Maroc sera mieux payé que nous ». Le mode de calcul de la rémunération n’est jamais précisément expliqué.

« Il y a clairement une forme de néocolonialisme. »

Antonio Casilli, professeur à l’Institut Polytechnique de Paris
sur franceinfo

Pour gagner des sommes décentes, les freelances doivent être disponibles à toute heure du jour et de la nuit et s’adapter à des projets de durée variable. « Sur Appen, les tâches arrivent à l’heure américaine, donc vers 21 heures en France »explique par exemple Astro*. « Sur une autre plateforme, j’ai reçu une tâche le vendredi vers 19 heures, j’ai travaillé 45 heures le week-end, j’ai gagné 1 200 euros »résume Astro, qui dit apprécier le travail de nuit.

Ce que certains considèrent comme une « opportunité professionnelle » peut aussi se transformer en piège. En Chine, des établissements promettent à leurs étudiants une formation en « IA » ou en « Big data », mais les obligent à annoter des images toute la journée pour un salaire inférieur au minimum légal, rapporte le média Reste du Monde. Cette pratique n’est pas spécifique à la Chine, assure Antonio Casilli, qui cite également l’exemple de Madagascar.

« L’IA ne peut pas être éthique si elle est entraînée de manière immorale »

À qui profite ce travail souvent ingrat, parfois à la limite de l’éthique ? Difficile de le savoir : l’industrie est entourée d’un épais voile de secret et, comme dans le cas de Mophat Okinyi, les annotateurs indépendants savent rarement à qui sont destinées les données qu’ils traitent. « Je sais que le client est au Japon, mais c’est tout. On ne nous a rien dit à leur sujet »note Eduardo* à propos d’une de ses missions d’annotation, assurée par Remotasks aux Philippines.

« Les entreprises d’IA expliquent que si elles étaient totalement transparentes sur leurs besoins en données, cela pourrait fournir des indices sur leurs projets en cours et influencer les réponses des contributeurs. »résume Antonio Casilli sur un ton sceptique. « Ils veulent échapper à leurs responsabilités »affirme Mophat Okinyi, qui ne savait pas que son travail serait utilisé par OpenAI avant la fin anticipée du contrat, à la demande de Sama, en mars 2022.

« Si les annotateurs savaient qu’ils travaillent pour une entreprise valant des centaines de millions de dollars comme OpenAI, ils n’accepteraient pas des salaires aussi bas. »

Mophat Okinyi, ancien analyste qualité chez Sama
sur franceinfo

Ce travail peut-il être organisé de manière à satisfaire tout le monde, géants de la tech comme travailleurs du clic ? « Il faut plus de transparence, les entreprises basées à San Francisco doivent prendre leurs responsabilités », réclame Mophat Okinyi. Il s’est associé à 150 travailleurs du secteur de l’annotation et de la modération des plateformes pour créer le Kenya Content Moderators Union, qui devrait obtenir une licence. « dans deux mois »et a cofondé l’ONG Techworker Community Africa pour plaider en faveur des meilleures pratiques. « L’IA ne peut pas être éthique si elle est entraînée de manière immorale, en exploitant des personnes en difficulté économique et à partir de données volées. » affirme-t-il.

« Beaucoup de gens ne savent pas qu’il y a un humain derrière l’IA. Cela devrait être mieux connu et mieux payé.

Astro, annotateur de données
sur franceinfo

Pour Antonio Casilli, il faut commencer par oublier l’idée selon laquelle l’IA n’est qu’une prouesse d’ingénieurs ou d’entrepreneurs. « Nous sommes tous en quelque sorte les producteurs de ces IA, car ce sont nos données qui servent à les entraîner, mais nous ne sommes pas reconnus comme tels. Tant que nous continuerons à penser que l’IA n’est que l’affaire de Sam Altman, nous aurons un problème. »

* Les prénoms suivis d’un astérisque ont été modifiés.