Bourse Entreprise

Qui est Scale AI, la startup qui fait le sale boulot des stars de l’IA, accusée d’« esclavage moderne »

Sa dernière levée de fonds colossale – 1 milliard de dollars – n’a pas fait grand bruit. Et pour cause : Scale AI est une société fantôme. Celui qui se définit comme « une fonderie de données » travaille pour le compte de géants de la lumière : Microsoft, Meta, le chouchou de l’intelligence artificielle OpenAI, mais aussi les constructeurs automobiles et l’armée américaine. Scale AI étiquette et vérifie les données utilisées par ces organisations pour entraîner leurs modèles d’intelligence artificielle. Pour obtenir des résultats plus précis et de meilleure qualité, ces systèmes ont besoin de données précises et de bonne qualité. Et c’est là qu’opère la société californienne. C’est elle notamment qui veille à ce que ChatGPT soit filtré de tout contenu violent et haineux, et qui édite certaines de ses productions pour éviter qu’il ne produise du charabia. C’est aussi elle qui étiquette les photos d’arbres ou de piétons, pour éviter que les futurs véhicules autonomes ne les confondent.

Ses nouveaux financements sont notamment apportés par le fabricant de puces Nvidia, Amazon, Meta, le fonds américain Accel, l’incubateur Y Combinator (qui est l’un de ses investisseurs historiques), ou encore Nat Friedman, ancien directeur de Github devenu l’entreprise préférée de l’industrie. ange. Scale AI avait déjà levé environ 600 millions de dollars depuis son lancement en 2016, dont une série E de 325 millions de dollars en 2021 qui la valorisait à environ 7 milliards de dollars. Trois ans plus tard, et malgré une période plus compliquée au cours de laquelle elle a licencié 20 % de ses effectifs l’année dernière, Scale AI est désormais valorisée à 13,8 milliards de dollars.

Créer une « abondance de données » pour atteindre « GPT-10 »

« Notre vision est celle d’une abondance de données, où nous disposons des moyens de production pour continuer à faire évoluer les LLM de pointe sur plusieurs ordres de grandeur. Nous ne devrions pas être limités par les données pour atteindre GPT-10 », précise Alexandr Wang, fondateur de l’entreprise. Pour le manager, le problème de « pénurie de données », souvent source d’inquiétude dans le secteur, est un choix. Il estime que son entreprise est capable de livrer « une abondance de données « . Il estime que pour cela, il faut aller au-delà des données simplement accessibles en ligne.

Intelligence artificielle : 16 géants (OpenAI, Google, Microsoft, Meta…) s’engagent pour plus de sécurité

Dans une interview au podcast Not Prior, le jeune dirigeant explique un peu plus clairement le problème. « Depuis que nous travaillons sur le sujet de l’IA générative (…) les ambitions ont considérablement augmenté. Nous sommes passés de GPT-3, qui a été une étape importante, mais est resté un modèle modeste, à aujourd’hui où nous souhaitons créer des agents autonomes, capables de raisonner, maîtrisant différents supports et différents langages… »

Pour atteindre ces objectifs beaucoup plus ambitieux, les modèles ne peuvent plus se contenter de lire les commentaires sur Reddit et d’autres textes facilement accessibles en ligne, explique-t-il. Ils ont besoin de données précieuses, qu’il appelle « des données de pointe » (données frontalières). Cela peut être la retranscription des raisonnements des meilleurs experts ou encore des données d’entreprises…

Pour produire ces données, Scale AI a donc fait appel depuis deux ans à des experts de différents domaines : mathématiciens, physiciens, journalistes sportifs, écrivains, historiens, poètes, spécialistes d’une langue particulière… Leur rôle : réviser les productions des grands modèles de langage. , ou produire de nouveaux contenus qui serviront à les former.

4 heures de travail pour 20 centimes

Bien qu’essentiels au développement de l’intelligence artificielle, les travaux de Scale AI ne sont pas toujours remarquables. À l’été 2023, le Washington Post compare les conditions de travail de Scale AI à celles d’un « atelier clandestin numérique ». Les médias américains sont allés à la rencontre des Philippins qui travaillent pour Scale AI. Tous sont indépendants et travaillent à domicile ou dans des cybercafés. Ils se plaignent de retards de paiement ou d’annulations, de salaires de misère (souvent inférieurs à la moyenne nationale, entre 6 et 10 dollars par jour selon les régions). Charisse, 23 ans, raconte par exemple qu’elle a travaillé 4 heures pour une tâche qui devait être payée 1 dollar. Elle a finalement reçu 30 centimes. Interrogé, un porte-parole de Scale AI affirme que les conditions de paiement « s’améliore chaque jour ».

Au cœur de cette enquête : la plateforme Remotetasks, propriété de Scale AI. Cela permet aux freelances du monde entier (240 000 selon les plateformes) de se connecter au travail « au travail ». Plus c’est complexe, mieux ils sont censés être payés. C’est ce qu’annonce Remotetasks sur la page d’accueil de son site. La rémunération dépendrait également de la rapidité d’exécution et de la qualité du travail, indique le Revue technologique du MIT. Cela encourage les travailleurs à accepter des charges de travail très intenses. Aux Philippines, 10 000 personnes sont connectées au site, rapporte le Washington Post. Mais la plateforme est également très présente au Kenya et au Venezuela.

Ce modèle parfois appelé « cliquez sur travailler  » Ou « travail numérique » n’est pas nouveau. Elle est même courante dans le monde de l’intelligence artificielle et est dénoncée depuis plusieurs années par des chercheurs comme le sociologue Antonio Casilli et la spécialiste du travail numérique Sarah Roberts. Il s’agit notamment du modèle Amazon Mechanical Turks, qui existe depuis 2005 et qui emploie des dizaines de milliers de personnes. Une multitude d’autres sites utilisent ce système : Appen, Hive Micro, ou encore Mighty AI. Tous sont basés aux États-Unis.

97 travailleurs kenyans dénoncent « l’esclavage moderne »

Ces derniers mois, les travailleurs de ces plateformes, et notamment chez Scale AI, se sont davantage mobilisés pour réclamer de meilleures conditions de travail et de rémunération.

Intelligence artificielle : quel rôle pour les chercheurs dans 30 ans ?

Le 22 mai, 97 travailleurs kenyans ont publié une lettre ouverte adressée au président Joe Biden (alors en visite dans leur pays), relayée par le magazine Filaire. Ces derniers se décrivent comme « étiqueteurs de données » (étiqueteurs de données) travaillant pour Scale AI et d’autres sous-traitants de Meta, TikTok et OpenAI.

« Nos conditions de travail s’apparentent à l’esclavage moderne », écrivent-ils. Nous faisons ce travail au détriment de notre santé, de nos vies et de nos familles. Les géants américains de la technologie exportent leurs emplois les plus durs et les plus dangereux à l’étranger. Ce travail est épuisant mentalement et émotionnellement. Nous nettoyons le web (…) Nous étiquetons les images et les textes pour former des outils d’IA générative comme OpenAI. Notre travail consiste à observer des meurtres et des décapitations, des abus et des viols d’enfants, de la pornographie et de la bestialité, souvent plus de 8 heures par jour. Beaucoup d’entre nous font ce travail pour moins de 2 dollars de l’heure. »

Les experts de divers domaines cités ci-dessus, qui permettent à Scale AI de produire les données « avant-garde » pour OpenAI et autres, sont également indépendants mais basés en Europe et aux États-Unis. Ils sont bien mieux payés : entre 30 et 60 dollars de l’heure. Mais eux aussi souffrent d’instabilité, rapporte Filaire. La plateforme les déconnecte parfois brutalement, sans explication, les coupant de leurs revenus. De plus, souligne le média américain, ils travaillent pour une technologie qui risque de rendre leur travail obsolète. « Je transmets à la machine les connaissances que j’ai et qu’elle n’a pas »» raconte Jay (son prénom a été modifié à sa demande), un mathématicien d’une vingtaine d’années, payé par Remotasks pour dire à ChatGPT si son raisonnement mathématique est correct ou non.