En coulisses : Comment ElevenLabs est devenue une entreprise leader de l'IA audio d'une valeur de 3 milliards de dollars grâce à Stripe

ElevenLabs fait partie des leaders mondiaux de la recherche et de la technologie d'IA audio. Elle conçoit des outils d'IA audio de pointe pour les entreprises, les développeurs et les créateurs. La plateforme permet à des millions de particuliers et des milliers d'entreprises (dont les employés de plus de 72 % des entreprises du Fortune 500) de créer des voix hors champ de haute qualité rapidement, à moindre coût et à grande échelle, en plus de lancer des agents vocaux d'IA interactifs dans plus de 30 langues.

Produits utilisés

    Billing
    Connect
    Payments
    Checkout
International
Jeunes entreprises


Ayant grandi en Pologne au début des années 2000, Mati Staniszewski et Piotr Dabkowski n’avaient d’autre choix que de regarder des films mal doublés. Comme le budget consacré au doublage de films étrangers en polonais est restreint, la plupart des films ne disposaient que d’un doubleur récitant les répliques de tous les personnages sans profondeur, nuance ou émotion.

Ces souvenirs d’enfance n’ont jamais quitté ces deux amis, même au début de leur carrière dans le secteur de la technologie, si bien qu’ils ont fini par faire germer une idée dans leur esprit : et s’il était possible de mettre fin aux mauvais doublages (et autres problèmes) en créant des voix synthétisées à la fois réalistes, émouvantes et adaptées au contexte?

C’est de cette idée qu’est née ElevenLabs, dont le lancement a eu lieu en 2022, la première entreprise à créer des voix artificielles capables d’imiter le langage (et même le rire) humain en exploitant les progrès de l’IA et de l’apprentissage profond. Grâce à cette avancée, la jeune pousse s’est retrouvée à l’avant-garde de la technologie d’IA audio. Aujourd’hui, ElevenLabs propose une gamme de produits de plus en plus étendue, qui comprend un moteur de synthèse vocale pour le contenu audio et vidéo, des outils de conception vocale pour développer des personnages, un studio de sous-titrage et de doublage et une boîte à outils pour créer des robots conversationnels capables d’interagir avec les clients.

Pour monétiser ses produits tout en se développant, l’entreprise avait besoin d’un partenaire de services de paiement lui aussi à la pointe de l’innovation. ElevenLabs, établie à Londres et à New York, a approché Stripe en 2023 pour le lancement d’abonnements à tarif fixe pour ses outils d’IA audio. Depuis, ElevenLabs s’est appuyée sur la gamme de produits de Stripe pour proposer des services professionnels et soutenir son modèle opérationnel en rapide évolution. À titre d’exemple, elle a profité des services de Stripe pour mener à bien des projets majeurs, notamment son marché où des comédiens et comédiennes de doublage peuvent mettre leur voix à disposition à des fins commerciales.

Prise en charge des abonnements, virements et flux agentifs à l’aide d’un ingénieur de la facturation

ElevenLabs a commencé avec 11 voix d’IA imitant la voix humaine. Contrairement aux anciennes voix d’IA robotiques, la technologie d’ElevenLabs reproduit les nuances liées à l’âge, à l’accent, au sexe, à l’intonation et à d’autres facteurs qui rendent chaque voix humaine unique. Ce réalisme, associé à la capacité de la plateforme à identifier les émotions à partir d’indices textuels, a contribué au succès du moteur de synthèse vocale d’ElevenLabs auprès des créateurs qui cherchaient à mettre à l’oral des scripts vidéo, des balados, des bulletins d’informations, des livres audio et n’importe quel autre contenu audio et vidéo.

ElevenLabs a choisi Stripe Billing pour commencer facilement, itérer rapidement et développer de manière fluide son service d’abonnement aux outils de synthèse vocale pour les créateurs de contenu et les éditeurs. La facilité d’utilisation de l’API et de la trousse SDK de Stripe a donné à l’équipe l’assurance de pouvoir créer rapidement plusieurs niveaux de tarification, sans y consacrer de temps d’ingénierie. La flexibilité de Billing a également permis à l’entreprise d’adapter ses offres d’abonnement pour répondre aux besoins d’un plus grand nombre de clients, à mesure qu’elle déployait des produits à grande échelle tels qu’un véritable studio de production audio et des services de doublage.

Grâce à la portée mondiale de Stripe, ElevenLabs a pu immédiatement accepter des abonnés du monde entier. Elle a également adopté la Suite d’optimisation des paiements de Stripe pour concevoir une page d’inscription à l’abonnement simple et efficace pour ses clients internationaux. Par exemple, l’entreprise a intégré le formulaire paiement préconfiguré dans le but de proposer facilement des portefeuilles numériques et des modes de paiement locaux tels que Apple Pay, Google Pay et Revolut Pay sans code supplémentaire requis. ElevenLabs a également ajouté la solution de paiement accéléré de Stripe, Link, pour permettre aux clients de remplir automatiquement leurs informations de paiement enregistrées n’importe où sur l’ensemble du réseau Link. Les utilisateurs de la Suite d’optimisation des paiements profitent d’une augmentation des taux de conversion, et l’expérience de paiement simple et plus rapide de Link représente désormais 20 % des paiements d’ElevenLabs. En exécutant Stripe sur AWS, ElevenLabs est soutenu par des outils d’IA intégrés pour localiser, personnaliser et optimiser l’expérience d’achat pour ses clients.

En tant qu’entreprise d’IA, ElevenLabs a vu le potentiel de l’IA de Stripe pour avoir un impact significatif sur le parcours des abonnés. Au lieu de s’appuyer sur des règles rigides, les modèles d’IA intégrés à la Suite d’optimisation des paiements déterminent de manière dynamique les modes de paiement à afficher et dans quel ordre pour chaque paiement, aidant ainsi ElevenLabs à offrir une expérience davantage personnalisée à ses utilisateurs.

Les produits Stripe ont également permis à ElevenLabs de gérer efficacement une série de tâches de facturation et de paiement, telles que la gestion des virements et la simplification du processus d’inscription des utilisateurs. En fait, ElevenLabs a réalisé ses intégrations Stripe et gère ses divers flux de travail de facturation et de paiement avec un seul ingénieur.

Quand ElevenLabs a mis au point une technologie de clonage vocal sophistiquée, l’entreprise a vu l’occasion de soutenir la communauté des comédiens de doublage professionnels et d’ajouter une nouvelle dimension à son modèle opérationnel. À l’aide de Stripe Connect, ElevenLabs a créé un marché où les acteurs peuvent cloner leur voix pour des projets commerciaux, définir des conditions et recevoir des virements chaque fois qu’un utilisateur d’ElevenLabs sélectionne leur voix pour un projet. Connect offrait des fonctionnalités prêtes à l’emploi pour gérer l’inscription des utilisateurs vocaux, y compris la prise en charge des virements internationaux et la gestion des obstacles réglementaires tels que les exigences de connaissance du client (KYC). Par exemple, la conformité aux règles de connaissance du client peut représenter un obstacle considérable pour les plateformes tout au long du processus d’inscription des utilisateurs. Les fonctionnalités de Stripe ont à nouveau permis d’économiser du temps de développement et des ressources qu’ElevenLabs a pu consacrer à ses projets principaux d’IA audio.

ElevenLabs a vu de nombreuses entreprises utiliser ses modèles de synthèse vocale (Text to Speech) et de reconnaissance vocale (Speech to Text) pour créer des agents d’IA. Ces entreprises mettaient souvent des mois à passer en production et reconstruisaient la même suite d’outils sous-jacente. ElevenLabs a donc lancé sa propre plateforme pour créer une voix d’IA conversationnelle pour que ses clients puissent passer en production plus rapidement et se concentrer sur le développement de la logique de l’agent plutôt que sur l’infrastructure. Grâce à la boîte à outils pour agents de Stripe, la plateforme d’agents d’ElevenLabs a pu produire des agents pour s’occuper des flux de ventes ou du service à la clientèle. Par exemple, l’agent d’IA d’une entreprise pourrait accéder à son compte Stripe pour émettre un remboursement ou conclure une transaction en envoyant un lien de paiement. « Le plus grand changement dans les agents d’IA conversationnelle consistera à passer de la simple réponse aux questions à l’utilisation de leur propre autonomie pour exécuter certaines actions », a déclaré M. Harries.

Un partenaire pour devancer la concurrence

ElevenLabs, qui proposait 11 voix à ses débuts, en possède désormais plus de 5 000 sur sa plateforme, en partie grâce à son marché sophistiqué. Les doubleurs ont reçu plus de 4 millions de dollars de la part de la plateforme et certaines voix les plus populaires rapportent jusqu’à 10 000 $ par mois à leurs propriétaires.

À ce jour, les utilisateurs ont déjà créé plus de 550 000 agents d’IA sur la plateforme, et ce chiffre devrait continuer à augmenter si l’on tient compte du nombre de cas d’usage rendus possibles par les robots conversationnels et les flux de travail agentifs. En parallèle, ElevenLabs continue d’enrichir la bibliothèque de langues de ses fonctionnalités de synthèse vocale et de doublage, avec désormais 33 langues prises en charge, dont l’anglais, le français et l’espagnol, ainsi que des langues moins répandues, comme le croate ou le tamoul.

Luke Harries compare la concurrence dans le secteur de l’IA audio à la Formule 1, où chaque entreprise recherche la nouvelle itération technologique ou le dernier produit innovant pour prendre la première position. De ce fait, il ne s’attend pas à ce que le rythme d’innovation ralentisse pour ElevenLabs, mais voit Stripe comme un partenaire clé pour poursuivre dans cette innovation.

Sachez exactement ce que vous payez

Une tarification par transaction intégrée sans aucuns frais cachés

Démarrez votre intégration

Lancez-vous sur Stripe en seulement 10 minutes