Exklusivbericht: So wurde der KI-Audioanbieter ElevenLabs mit Stripe auf 3 Mrd. USD bewertet

ElevenLabs ist Weltmarktführer für die Erforschung und Entwicklung von KI-Sprachtechnologie und entwickelt bahnbrechende KI-Audiotools für Unternehmen, Entwickler und Kreative. Mit ElevenLabs können Millionen Privatpersonen und Tausende Firmen, darunter auch über 72 % der Fortune 500, schnell und kostengünstig hochwertige Voiceover-Aufnahmen anfertigen und interaktive KI-Sprachassistenten in mehr als 30 Sprachen einrichten.

Lösungen im Einsatz

    Billing
    Connect
    Payments
    Checkout
Global
Start-up


Als Mati Staniszewski und Piotr Dabkowski in den frühen 2000er-Jahren in Polen aufwuchsen, konnten sie die schlecht synchronisierten Filme, die sie sich ansehen mussten, nicht ausstehen. Es gibt nur ein begrenztes Budget für die Synchronisation fremdsprachiger Filme ins Polnische. Das führte dazu, dass bei den meisten Filmen nur ein/e einzige/r Sprecher/in den Text aller Figuren ohne Tiefe, Nuancen oder Emotionen vorlas.

Diese Kindheitserfahrungen blieben den Freunden auch im Gedächtnis, während sie ihre Karrieren in der Tech-Branche aufnahmen und brachten sie schließlich auf eine Idee: Was wäre, wenn sie das Problem der schlechten Synchronisation – und viele weitere – lösen könnten, indem sie realistische, emotionale und kontextbezogene künstliche Stimmen erstellten?

Diese Idee führte 2022 zur Gründung von ElevenLabs. Das Unternehmen nutzte die Fortschritte in den Bereichen KI und Deep Learning und war das erste Unternehmen, das künstliche Stimmen entwickelte, die menschliche Sprache (und sogar Lachen) erzeugen können. Dieser Durchbruch verhalf dem Start-up an die Spitze der KI-Audiotechnologie. Heute bietet ElevenLabs eine wachsende Produktsuite an, die eine Text-to-Speech-Engine für Audio- und Videoinhalte, Voice-Design-Tools für die Charakterentwicklung, ein Übersetzungs- und Synchronisationsstudio sowie ein Toolkit für dialogorientierte KI-Chatbots umfasst, die mit Kundinnen und Kunden interagieren können.

Die Monetarisierung dieser Produkte erforderte, während das Unternehmen skalierte, einen ebenso fortschrittlichen Zahlungspartner. Das in London und New York ansässige Unternehmen ElevenLabs wandte sich 2023 an Stripe, um Flatrate-Abonnements für seine Audio-KI-Tools einzuführen. Seitdem verlässt sich ElevenLabs auf die Tiefe der Produkte von Stripe, um in Dienste auf Enterprise-Niveau zu expandieren und sein sich schnell entwickelndes Geschäftsmodell zu unterstützen. So hat sich das Unternehmen beispielsweise beim Ausbau wichtiger Initiativen wie seinem Marktplatz, auf dem Synchronsprecher/innen und ihre Stimmen für die kommerzielle Nutzung lizenzieren können, auf Stripe gestützt.

Unterstützung von Abonnements, Auszahlungen und Agenten-Workflows mit nur einer Entwicklungsfachkraft für die Abrechnung

ElevenLabs startete mit 11 menschenähnlichen KI-Stimmen. Im Gegensatz zu früheren robotergestützten KI-Stimmen bildet die Technologie von ElevenLabs die Nuancen von Alter, Akzent, Geschlecht, Intonation und anderen Faktoren nach, die jede menschliche Stimme einzigartig machen. Dieser Realismus, kombiniert mit der Fähigkeit der Plattform, Emotionen aus textlichen Hinweisen abzuleiten, machte die Text-to-Speech-Engine von ElevenLabs zu einem Hit bei Creator/innen, die Videoskripte, Podcasts, Nachrichten, Hörbücher und fast jede andere Art von Audio- oder Videoinhalten vertonen möchten.

ElevenLabs entschied sich für Stripe Billing, um einen einfachen Start zu ermöglichen, schnell zu iterieren und den Abonnementdienst für Voice-to-Text-Tools für Content-Creator/innen und Publisher/innen reibungslos zu skalieren. Die einfache Arbeit mit der Stripe-API und dem SDK gab dem Team das Vertrauen, in kurzer Zeit mehrere Preisstufen ohne nennenswerten technischen Aufwand entwickeln zu können. Die Flexibilität von Billing bedeutete zudem, dass das Unternehmen seine Abonnementangebote skalieren konnte, um größeren Kundinnen und Kunden gerecht zu werden, als es Produkte im Enterprise-Format wie ein vollwertiges Audioproduktionsstudio und Synchronisationsdienste auf den Markt brachte.

Mit der globalen Reichweite von Stripe konnte ElevenLabs sofort Abonnentinnen und Abonnenten aus der ganzen Welt annehmen. Das Unternehmen nutzte die Suite zur Optimierung des Bezahlvorgangs von Stripe, um eine einfache, effektive Registrierungsseite für Abonnements für seine globale Kundschaft zu gestalten. Beispielsweise bettete das Unternehmen das vorgefertigte Checkout-Formular auf seiner Seite ein, was es einfach machte, Digital Wallets und lokale Zahlungsmethoden wie Apple Pay, Google Pay und Revolut Pay ohne zusätzlichen Programmieraufwand anzubieten. ElevenLabs fügte zudem die Lösung für einen beschleunigten Bezahlvorgang von Stripe, Link, hinzu, um Kundinnen und Kunden die Möglichkeit zu geben, ihre gespeicherten Zahlungsinformationen überall im Link-Netzwerk automatisch auszufüllen. Nutzerinnen und Nutzer der Suite zur Optimierung des Bezahlvorgangs profitieren von einer Steigerung der Konversionsraten und das einfache, schnellere Bezahlvorgangerlebnis von Link macht nun 20 % der Zahlungen von ElevenLabs aus. Durch die Ausführung von Stripe auf AWS wird ElevenLabs durch integrierte KI-Tools unterstützt, um das Einkaufserlebnis für seine Kundinnen und Kunden lokal anzupassen, zu personalisieren und zu optimieren.

Als KI-Unternehmen erkannte ElevenLabs das Potenzial der KI von Stripe, das Erlebnis seiner Abonnentinnen und Abonnenten maßgeblich zu verbessern. Anstatt sich auf starre Regeln zu verlassen, bestimmen die in die Suite zur Optimierung des Bezahlvorgangs integrierten KI-Modelle dynamisch, welche Zahlungsmethoden bei jedem Bezahlvorgang in welcher Reihenfolge angezeigt werden. Dies hilft ElevenLabs dabei, eine stärker personalisierte Nutzererfahrung zu bieten.

Die Produkte von Stripe ermöglichten es ElevenLabs zudem, eine Reihe von Abrechnungs- und Zahlungsaufgaben effizient zu verwalten, wie beispielsweise die Verwaltung von Auszahlungen und die Vereinfachung des Onboarding-Prozesses. Tatsächlich hat ElevenLabs seine Stripe-Integrationen mit nur einer Entwicklungsfachkraft abgeschlossen und benötigt auch für seine verschiedenen Abrechnungs- und Zahlungs-Workflows kein weiteres Personal.

Als ElevenLabs eine ausgefeilte Technologie zum Klonen von Stimmen entwickelte, sah das Unternehmen eine Möglichkeit, die Community professioneller Synchronsprecher/innen zu unterstützen und seinem Geschäftsmodell eine weitere neue Ebene hinzuzufügen. Mithilfe von Stripe Connect erstellte ElevenLabs einen Marktplatz, auf dem Sprecher/innen ihre Stimmen für kommerzielle Projekte klonen, Konditionen festlegen und Auszahlungen erhalten können, wenn ein/e Nutzer/in von ElevenLabs ihre Stimme für ein Projekt auswählt. Connect bot sofort einsatzbereite Funktionen für das Onboarding von Sprecherinnen und Sprechern, einschließlich der Unterstützung internationaler Auszahlungen und der Bewältigung regulatorischer Hürden wie den KYC-Anforderungen (Know Your Customer). Die Compliance mit KYC-Vorschriften kann beispielsweise für Plattformen während des gesamten Onboarding-Prozesses eine erhebliche Hürde darstellen. Die Funktionen von Stripe sparten erneut Entwicklungszeit und Ressourcen, die ElevenLabs so für seine Kernprojekte im Bereich der Audio-KI einsetzen konnte.

ElevenLabs stellte fest, dass viele Unternehmen seine Text-to-Speech- und Speech-to-Text-Modelle nutzten, um KI-Agenten zu entwickeln. Die Unternehmen brauchten oft Monate, um in die Produktion zu gehen, und bauten denselben zugrunde liegenden Stack erneut auf. Daher brachte ElevenLabs eine eigene Plattform auf den Markt, um eine dialogorientierte KI-Stimme zu erstellen, damit Kundinnen und Kunden schneller in die Produktion gehen und sich auf den Aufbau der Agenten-Geschäftslogik anstatt auf die Infrastruktur konzentrieren können. Mit dem Agent-Toolkit von Stripe konnte die Agentenplattform von ElevenLabs Agenten in die Lage versetzen, Kundenservice- oder Vertriebs-Workflows abzuschließen. So kann beispielsweise der KI-Agent eines Unternehmens auf sein Stripe-Konto zugreifen, um eine Rückerstattung vorzunehmen oder eine Transaktion abzuwickeln, indem er einen Link zum Bezahlvorgang sendet. „Die größte Veränderung bei dialogorientierten KI-Agenten betrifft die Verschiebung von der reinen Beantwortung von Fragen hin zur Nutzung ihrer eigenen Autonomie für die Ausführung bestimmter Aktionen“, sagt Harries.

Ein Partner, der ElevenLabs den Vorsprung vor der Konkurrenz sichert

Aufbauend auf diesen ersten 11 Stimmen stehen auf der Plattform von ElevenLabs mittlerweile mehr als 5.000 Stimmen zur Verfügung – teilweise angetrieben durch die modernste Technologie seines Marktplatzes. Die Plattform hat mehr als 4 Millionen $ an Synchronsprecher/innen ausgezahlt, wobei einige der Spitzenverdiener/innen mehr als 10.000 $ pro Monat verdienen.

Die Nutzer/innen haben bereits mehr als 550.000 KI-Agenten auf der Plattform erstellt. Dies ist erst der Anfang, wenn man die Anzahl der Use Cases bedenkt, die durch wirklich dialogorientierte Bots und agentenbasierte Workflows ermöglicht werden. ElevenLabs fügt auch weiterhin neue Sprachen zu seinen Text-to-Speech- und Synchronisationsfunktionen hinzu, die nun 33 Sprachen von Englisch, Französisch und Spanisch bis hin zu neueren Ergänzungen wie Kroatisch und Tamil unterstützen.

Harries vergleicht den Wettbewerb im KI-Audio-Bereich mit der Formel 1, bei der jedes Unternehmen nach der nächsten technologischen Iteration oder dem nächsten bahnbrechenden Produkt sucht, das es an die Spitze des Feldes bringt. Infolgedessen erwartet er nicht, dass sich das Innovationstempo für ElevenLabs in absehbarer Zeit verlangsamen wird. Und er sieht Stripe als wichtigen Partner für die Fortsetzung dieser Innovation.

Absolute Preistransparenz

Integrierte Preisgestaltung pro Transaktion ohne versteckte Transaktionsgebühren

Schnelle Integration

Starten Sie mit Stripe in weniger als 10 Minuten