« Incroyable », « magique »… Sur les réseaux sociaux, les superlatifs abondent pour décrire NotebookLM, un outil né dans les laboratoires de Google Labs il y a un an et qui fait le buzz en ligne depuis sa récente mise à jour. Pour la première fois, un outil d’IA permet de synthétiser différents documents en quelques clics et surtout de les transformer en un podcast d’une dizaine de minutes, disponible uniquement en anglais pour l’instant, mettant en scène une conversation entre deux animateurs virtuels. .
Résultat : les internautes s’amusent à l’utiliser sur tous types de contenus, notamment des documents techniques, leur profil LinkedIn, un relevé bancaire, un échange de messages… Pour autant, l’outil n’est pas exempt d’erreurs, mais comme avec ChatGPT à ses débuts , c’est l’effet bluffant qui prime pour le moment. Certains affirment que « Plongées profondes », nom donné à ces conversations, sont devenus leurs podcasts préférés. Un effet viral bienvenu pour Google, qui manquait jusqu’ici d’un succès original majeur en matière d’IA générative.
Souvenez-vous : lors du lancement du chatbot OpenAI fin 2022, Google déclenchait le « code rouge », l’équivalent de son alarme incendie. Malgré son problème de fiabilité lié aux « hallucinations » de l’IA générative, ChatGPT a été vu dès le départ comme une nouvelle façon de rechercher des informations en ligne. De quoi donner des sueurs froides à Google, qui détient le monopole de ce marché depuis plus de vingt ans.
L’une des briques technologiques de ChatGPT est née dans les laboratoires du géant du web en 2017. Mais c’est une autre société, OpenAI, qui a réussi à en faire un produit largement utilisé. Certes, Google a tenté de rattraper son challenger en développant son propre grand modèle de langage (LLM), Gemini, et en l’intégrant à son moteur de recherche. Dans une centaine de pays, cette IA impose aux utilisateurs des synthèses de leurs requêtes générées par l’IA. Mais loin de susciter l’enthousiasme, AI Overviews est surtout moqué pour ses erreurs et ses absurdités. Et c’est finalement NotebookLM, plus expérimental, qui a suscité les éloges, même s’il reste loin des records d’utilisation de ChatGPT à ses débuts. Raiza Martin, chef de produit de l’équipe d’une dizaine de personnes derrière l’outil, explique La Tribune la genèse et l’avenir de ce projet.
LA TRIBUNE – Quelle est l’origine de NotebookLM ?
Raïza MARTIN – Tout est parti d’une demande générale de Josh Woodward, le responsable de Google Labs. Il m’a dit : « Imaginez un produit centré sur l’IA, autour duquel on pourrait construire un véritable modèle économique. » A cette époque, je travaillais avec un ingénieur, Adam Bignell, qui développait une technologie appelée « Talk to Small Corpus ». Aujourd’hui, nous savons que les IA, en particulier les grands modèles linguistiques (LLM), sont très efficaces pour traiter des ensembles de données, notamment textuelles.
L’idée était donc d’utiliser l’IA pour interagir avec des textes. Plus précisément, partir d’une source spécifique offrait un contexte complètement différent d’une simple conversation avec un modèle. C’est la grande innovation de NotebookLM : partir d’un contenu donné par l’utilisateur (un document, une pile de slides, etc.) et en discuter avec l’IA.
OpenAI vient de lancer Search GPT, un moteur de recherche dont l’ambition est de détrôner Google. Pourquoi ne pas concentrer vos efforts sur le cœur de métier de Google, la recherche en ligne, pour résister à cette nouvelle concurrence, plutôt que de développer un produit si différent ?
Raïza MARTIN – Nous avons pensé à la « routine » d’une personne qui travaille avec un ordinateur. Parfois, nous recherchons des sources, ce qui est une recherche classique. Mais souvent, le défi vient après : « J’ai retrouvé mes sources. Que faire avec ça maintenant ? » NotebookLM se trouve exactement dans cette zone. Google excelle dans la recherche. Nous avons donc choisi de travailler sur la suite : lire, réfléchir, extraire des idées, structurer un point de vue… Avec l’arrivée des LLM, ces processus traditionnels ont énormément évolué. Cela ouvre de nouvelles possibilités.
Le succès de NotebookLM est principalement lié à Audio Overview, une fonctionnalité qui permet de générer un podcast virtuel avec deux animateurs résumant un sujet tout en discutant. Pourquoi ce format ?
Avant l’audio, nous avons exploré des fonctionnalités telles que la rédaction de documents, la création de diapositives ou la rédaction d’e-mails. Mais tout cela restait du texte et ne changeait pas fondamentalement le mode d’interaction avec l’IA. Cependant, les gens apprennent et consomment l’information de manières très différentes. L’une des premières fonctionnalités de NotebookLM, la génération de résumés, a connu dès le départ un énorme succès. Aujourd’hui, tout le monde veut un résumé de quelque chose.
Nous avons donc naturellement pensé au format audio. Et nous voulions aller au-delà de la simple lecture de texte avec la synthèse vocale, qui est souvent un peu ennuyeuse. Notre objectif était de rendre cette fonctionnalité utile, agréable et innovante.
Certains observateurs disent que c’est un peu un moment « ChatGPT » pour Google. Vous attendiez-vous à ce succès ?
Je ne pensais pas que ça prendrait une telle ampleur. Ce qui est fascinant, c’est que les utilisateurs veulent immédiatement essayer NotebookLM avec toutes sortes de contenus. Pour moi, c’est un signe clair de son potentiel.
NotebookLM a-t-il le potentiel de devenir véritablement un outil grand public ? N’est-il pas plutôt réservé aux personnes habituées à travailler avec des documents, comme les chercheurs ou les journalistes ?
Nous ne partageons pas le nombre d’utilisateurs actifs, mais l’utilisation de l’outil a plus que décuplé en un mois. Au début, nos utilisateurs étaient majoritairement des étudiants et des enseignants, qui sont souvent les premiers à adopter les nouvelles technologies. Certains échanges invitent à essayer avec NotebookLM pour les aider dans leurs révisions. Mais ils ne sont plus les seuls.
Aujourd’hui, plus de la moitié de nos utilisateurs sont des professionnels, avec une forte adoption par les commerciaux, mais aussi par les personnes travaillant dans la finance. NotebookLM reste pertinent pour tous ceux qui travaillent sur un ordinateur.
Envisagez-vous d’intégrer NotebookLM dans la page d’accueil de la recherche Google ou de le monétiser ?
NotebookLM est actuellement un service indépendant. Nous avons récemment lancé « NotebookLM Business », activement utilisé par plus de 80 000 entreprises. C’est un pilote avec un accès anticipé, donc ils ne paient pas encore.
Le succès de NotebookLM – qui tient plus au format qu’à la puissance du modèle lui-même – signifie-t-il que les performances de l’IA ne sont plus la priorité ? Et qu’il faut se concentrer sur les usages ?
Ces deux aspects avancent en parallèle. Les capacités des modèles sont cruciales, tout comme leur traduction en produits utiles pour les utilisateurs. L’un ne peut exister sans l’autre.
Commentaires recueillis par Marine Protais