Bakom kulisserna: Så växte ElevenLabs till att bli ett ledande företag inom AI-ljud som omsätter 3 miljarder dollar tack vare Stripe

ElevenLabs är det globalt ledande företaget inom forskning och teknik på området AI-ljud och bygger avancerade AI-ljudverktyg för företag, utvecklare och kreatörer. Plattformen gör det möjligt för miljontals individer och tusentals företag, inklusive anställda inom drygt 72 % av företagen på listan Fortune 500, att snabbt och till ett rimligt pris skapa berättarröster i stor skala och av hög kvalitet, och lansera interaktiva AI-röstagenter på mer än 30 språk.

Använda produkter

    Billing
    Connect
    Payments
    Checkout
Globalt
Startup

Mati Staniszewski och Piotr Dabkowski växte upp i Polen i början av 2000-talet och stod inte ut med de dåligt dubbade filmer de försökte se. Budgeten för dubbning av utländska filmer var begränsad i Polen, vilket innebar att för de flesta filmer användes bara en enda röstskådespelare som läste upp de olika replikerna utan särskilt mycket djup, nyans eller känsla.

De här barndomsupplevelserna dröjde sig kvar hos de två vännerna när de gjorde karriär inom tech-branschen och det utmynnade så småningom i en idé: tänk om de kunde lösa problemet med den dåliga dubbningen – och kanske även andra problem – genom att skapa realistiska syntetiska röster med känsla, som anpassade sig till sammanhanget?

Den här idén ledde till att de 2022 startade ElevenLabs, som utnyttjade utvecklingen på AI-området och inom djupgående inlärning. Det blev det första företaget som utvecklade artificiella röster som klarar att återge människoliknande tal (och till och med skratt). Det här genombrottet innebar att startup-företaget låg i framkant när det gäller AI-baserad ljudteknik. I dag erbjuder ElevenLabs en växande produktsvit som inkluderar en text-till-tal-motor för ljud- och videoinnehåll, röstdesignverktyg för karaktärutveckling, en översättnings- och dubbningsstudio och en verktygslåda för AI-styrda samtalschattbotar som kan interagera med kunder.

För att företaget skulle kunna monetarisera de här produkterna i takt med att man växte krävdes en lika avancerade betalningspartner. London- och New York-baserade ElevenLabs vände sig till Stripe 2023 för att få hjälp att lansera abonnemang med en fast avgift på företagets AI-ljudverktyg. Sedan dess har ElevenLabs förlitat sig på Stripe-produkternas djupgående funktioner för att kunna erbjuda tjänster för stora företag och få stöd för företagets affärsmodell som hela tiden utvecklas. Exempelvis har företaget använt sig av Stripe när man byggt ut stora projekt som den marknadsplats där röstskådespelare kan sälja licenser till sina röster för kommersiell användning.

"Vi började för två och ett halvt år sedan och är nu ett enhörningsföretag", säger Luke Harries, Head of Growth hos ElevenLabs. "Hundratusentals självbetjäningsabonnenter och företag som Perplexity, Time Magazine och Bertelsmann använder vår plattform. Alla de här betalningarna har hanterats av vår chefsutvecklare som konfigurerat Stripe."

Stöd för abonnemang, utbetalningar och agentbaserade arbetsflöden med en enda faktureringsutvecklare

ElevenLabs startade med elva människoliknande AI-röster. Till skillnad från tidigare robotiserade AI-röster återger ElevenLabs teknik olika nyanser som ålder, brytning, kön, betoning och andra faktorer som gör varje mänsklig röst unik. Denna realism, i kombination med plattformens förmåga att bedöma känslor utifrån textbaserade ledtrådar, har gjort ElevenLabs text-till-tal-motor populär bland kreatörer som vill ha en röst som läser upp videomanus, poddar, nyheter, ljudböcker och nästan alla andra typer av ljud- eller videoinnehåll.

ElevenLabs valde Stripe Billing för att komma igång på ett enkelt sätt, snabbt iterera och smidigt skala upp abonnemangstjänsten för tal-till-text-verktyg för innehållskreatörer och utgivare. Eftersom det var så enkelt att arbeta med Stripes API och SDK blev teamet övertygat om att de snabbt skulle kunna bygga olika prisnivåer utan att det skulle krävas nästan något utvecklingsarbete alls. Flexibiliteten hos Billing innebar också att företaget kunde skala upp sitt utbud av abonnemang så att det även skulle fungera för större kunder när man lanserade storskaliga produkter som en komplett ljudproduktionsstudio och dubbningstjänster.

Med Stripes globala räckvidd kunde ElevenLabs direkt godkänna abonnenter från hela världen och företaget använde Stripes Optimized Checkout Suite för att utforma en enkel, effektiv registreringssida för abonnemang för den globala målgruppen. Exempelvis integrerade företaget det färdiga kassaformuläret på sin sida, vilket gjorde det enkelt att erbjuda digitala plånböcker och lokala betalningsmetoder som Apple Pay, Google Pay och Revolut Pay utan att det krävdes någon ytterligare kodning. ElevenLabs lade också till Stripes snabba kassalösning, Link, för att göra det möjligt för kunderna att automatiskt fylla i sparade betalningsuppgifter överallt i Link-nätverket. Användare av Optimized Checkout Suite drar fördel av att konverteringsgraden ökar och Links enkla, snabbare kassaupplevelse svarar nu för 20 % av ElevenLabs betalningar.

Som ett AI-företag såg ElevenLabs den potential som Stripes AI hade att kunna påverka abonnentresan på ett avgörande sätt. Istället för att förlita sig på strikta regler fastställer de AI-modeller som är inbyggda i Optimized Checkout Suite dynamiskt vilka betalningsmetoder som ska visas och i vilken ordning för varje betalning. Det hjälper ElevenLabs erbjuda en mer individanpassad användarupplevelse.

Stripe-produkter gjorde det också möjligt för ElevenLabs att på ett effektivt sätt hantera olika fakturerings- och betalningsuppgifter, som att hantera utbetalningar och förenkla onboarding-processen. ElevenLabs genomförde sina Stripe-integrationer och hanterar sina olika arbetsflöden för fakturering och betalning med hjälp av bara en utvecklare. "Om vi hade varit tvungna att utveckla all infrastruktur för abonnemang internt för att kunna hantera olika geografiska regioner tror jag att vi hade behövt ett helt utvecklarteam som enbart arbetade med betalningar", säger Harries.

När ElevenLabs utvecklade sofistikerad teknik för röstkloning såg företaget en möjlighet att stödja yrkesgruppen röstskådespelare och lägga till ett nytt lager i sin affärsmodell. Med hjälp av Stripe Connect skapade ElevenLabs en marknadsplats där skådespelare kan klona sina röster för kommersiella projekt, ange villkor och ta emot utbetalningar när en ElevenLabs-användare väljer deras röst för ett projekt. Connect erbjöd färdiga funktioner för att hantera onboarding av röstskådespelare, inklusive stöd för internationella utbetalningar och hanterar av lagstiftningsrelaterade hinder som krav på kundkännedom. Exempelvis kan efterlevnad av regler för kundkännedom innebära ett betydande hinder för plattformar under hela onboarding-processen. Stripes funktioner sparade än en gång utvecklingstid och resurser som ElevenLabs i stället kunde lägga på sina kärnprojekt inom AI-ljud.

ElevenLabs såg att många företag använde text-till-tal- och tal-till-text--modeller för att bygga AI-agenter. Det tog ofta många månader för företagen att komma i produktion och de återuppbyggde med samma underliggande stack. Därför lanserade ElevenLabs sin egen plattform för att skapa en AI-röst för samtal så att kunderna kunde komma i produktion snabbare och fokusera på att bygga affärslogiken för agenten – och inte på infrastrukturen. Med Stripes agentverktyg kunde ElevenLabs agentplattform göra det möjligt för agenter att hantera arbetsflöden inom kundservice eller försäljning. Exempelvis kan ett företags AI-agent gå in på Stripe-kontot för att utfärda en återbetalning eller genomföra en transaktion genom att skicka ut en betalningslänk. "Den största förändringen när det gäller AI-agenter för samtal kommer att handla om att gå från att bara besvara frågor till att nu använda deras egen autonomi för att vidta vissa åtgärder", säger Harries.

En partner som ser till att ElevenLabs ligger steget före konkurrenterna

Genom att bygga vidare på de första 11 rösterna har ElevenLabs nu mer än 5 000 röster tillgängliga på sin plattform – som delvis drivs av företagets avancerade marknadsplats. Plattformen har betalat ut mer än 4 miljoner dollar till röstskådespelare, där de som tjänar mest drar in mer än 10 000 dollar i månaden.

Användarna har redan skapat mer än 550 000 AI-agenter på plattformen, vilket bara är början med tanke på det stora antal användningsfall som möjliggörs av renodlade samtalsbotar och agentbaserade arbetsflöden. ElevenLabs fortsätter också att lägga till fler språk till sina text-till-tal- och dubbningsfunktioner, som nu har stöd för 33 språk – från engelska, franska och spanska till nya tillskott som kroatiska och tamil.

Harries jämför konkurrensen på området AI-ljud med Formel 1, där alla företag letar efter nästa teknikiteration eller banbrytande produkt som gör att man kan ta täten. Det innebär att han inte förväntar sig att innovationstakten kommer att minska under den närmaste framtiden för ElevenLabs. Och han ser Stripe som en viktig partner för att kunna fortsätta med detta innovationsarbete.

"Jag ser fram emot att kunna skala upp till betydligt större volymer med Stripe och [göra] ytterligare flera miljoner betalningar till röstskådespelare på vår plattform samt expandera till betydligt fler länder och fler betalningsalternativ", säger Harries.

Supporting subscriptions, payouts, and agentic workflows with one billing engineer

ElevenLabs started with 11 human-like AI voices. Unlike previous robotic AI voices, ElevenLabs technology replicates the nuances of age, accent, gender, intonation, and other factors that make each human voice unique. That realism, combined with the platform’s ability to gauge emotion from textual clues, made ElevenLabs’ Text to Speech engine a hit among creators looking to voice video scripts, podcasts, news reports, audiobooks, and almost any other type of audio or video content.

ElevenLabs chose Stripe Billing to get started easily, iterate rapidly, and seamlessly scale its subscription service for voice-to-text tools for content creators and publishers. The ease of working with the Stripe API and SDK made the team confident they could quickly build multiple pricing tiers with virtually no engineering time dedicated to the task. Billing’s flexibility also meant the company could scale its subscription offerings to accommodate larger customers as it rolled out enterprise-scale products such as a full-fledged audio production studio and dubbing services.

With Stripe’s global reach, ElevenLabs was able to instantly accept subscribers from all over the world, and the company used Stripe’s Optimized Checkout Suite to design a simple, effective subscription sign-up page for the global audience. For example, the company embedded the prebuilt Checkout form on its page, which made it easy to offer digital wallets and local payment methods such as Apple Pay, Google Pay, and Revolut Pay with no additional coding required. ElevenLabs also added Stripe’s accelerated checkout solution, Link, to enable customers to autofill their saved payment information anywhere across the Link network. Optimized Checkout Suite users benefit from an uplift in conversion rates, and Link’s easy, faster checkout experience now accounts for 20% of ElevenLabs’ payments. By running Stripe on AWS, ElevenLabs is supported by built-in AI tools to localize, personalize, and optimize the buying experience for its customers.

As an AI company, ElevenLabs saw the potential for Stripe’s AI to make a significant impact on the subscriber journey. Instead of relying on rigid rules, the AI models built into the Optimized Checkout Suite dynamically determine which payment methods to display in what order for every checkout, helping ElevenLabs provide a more personalized user experience.

Stripe products also enabled ElevenLabs to efficiently manage a range of billing and payment tasks, such as managing payouts and simplifying the onboarding process. In fact, ElevenLabs accomplished its Stripe integrations and is managing its various billing and payment workflows with just one engineer.

When ElevenLabs developed sophisticated voice cloning technology, the company saw an opportunity to support the professional voice actor community and add another new layer to its business model. Using Stripe Connect, ElevenLabs created a marketplace where actors can clone their voices for commercial projects, set terms, and receive payouts any time an ElevenLabs user selects their voice for a project. Connect offered ready-to-use capabilities to handle voice actor onboarding, including supporting international payouts and managing regulatory hurdles such as Know Your Customer (KYC) requirements. For instance, compliance with KYC rules can pose a considerable hurdle for platforms throughout the onboarding process. Stripe’s features again saved development time and resources that ElevenLabs could dedicate to its core audio AI projects.

ElevenLabs saw many companies using their Text to Speech and Speech to Text models to build AI agents. The companies often took months to get in production and were rebuilding the same underlying stack. So ElevenLabs launched their own platform to create a Conversational AI voice for customers to get to production quicker and focus on building the agent business logic rather than infrastructure. With the Stripe agent toolkit, ElevenLabs’ agent platform could enable agents to complete customer service or sales workflows. For example, a business’s AI agent could reach into its Stripe account to issue a refund or complete a transaction by sending out a checkout link. “The biggest shift in conversational AI agents is going to be from just pure question answering, to now using their own autonomy to execute certain actions,” said Harries.

A partner to keep ElevenLabs ahead of the competition

Building on those first 11 voices, ElevenLabs now has more than 5,000 voices available on its platform—driven in part by its advanced marketplace. The platform has paid out more than $4 million to voice actors, with some top earners making more than $10,000 a month.

Already, users have made more than 550,000 AI agents on the platform, which is just the start, considering the number of use cases enabled by truly conversational bots and agentic workflows. ElevenLabs also continues to add more languages to its Text to Speech and dubbing capabilities, which now supports 33 languages ranging from English, French, and Spanish to newer additions such as Croatian and Tamil.

Harries likens the competition in the AI audio space to Formula 1, where every company is looking for the next technology iteration or breakthrough product to power it to the front of the field. As a result, he doesn’t expect the pace of innovation to slow anytime soon for ElevenLabs. And he sees Stripe as a key partner for continuing that innovation.

Vet vad du betalar för

Integrerad transaktionsbaserad prissättning utan dolda avgifter

Påbörja din integration

Kom igång med Stripe på så lite som 10 minuter