ㅤ
Als Mati Staniszewski und Piotr Dabkowski in den frühen 2000er-Jahren in Polen aufwuchsen, konnten sie die schlecht synchronisierten Filme, die sie sich ansehen mussten, nicht ausstehen. Es gibt nur ein begrenztes Budget für die Synchronisation fremdsprachiger Filme ins Polnische. Das führte dazu, dass bei den meisten Filmen nur ein/e einzige/r Sprecher/in den Text aller Figuren ohne Tiefe, Nuancen oder Emotionen vorlas.
Diese Kindheitserfahrungen blieben den Freunden auch im Gedächtnis, während sie ihre Karrieren in der Tech-Branche aufnahmen und brachten sie schließlich auf eine Idee: Was wäre, wenn sie das Problem der schlechten Synchronisation – und viele weitere – lösen könnten, indem sie realistische, emotionale und kontextbezogene künstliche Stimmen erstellten?
Diese Idee führte 2022 zur Gründung von ElevenLabs. Das Unternehmen nutzte die Fortschritte in den Bereichen KI und Deep Learning und war das erste Unternehmen, das künstliche Stimmen entwickelte, die menschliche Sprache (und sogar Lachen) erzeugen können. Dieser Durchbruch verhalf dem Start-up an die Spitze der KI-Audiotechnologie. Heute bietet ElevenLabs eine wachsende Produktsuite an, die eine Text-to-Speech-Engine für Audio- und Videoinhalte, Voice-Design-Tools für die Charakterentwicklung, ein Übersetzungs- und Synchronisationsstudio sowie ein Toolkit für dialogorientierte KI-Chatbots umfasst, die mit Kundinnen und Kunden interagieren können.
Die Monetarisierung dieser Produkte erforderte, während das Unternehmen skalierte, einen ebenso fortschrittlichen Zahlungspartner. Das in London und New York ansässige Unternehmen ElevenLabs wandte sich 2023 an Stripe, um Flatrate-Abonnements für seine Audio-KI-Tools einzuführen. Seitdem verlässt sich ElevenLabs auf die Tiefe der Produkte von Stripe, um in Dienste auf Enterprise-Niveau zu expandieren und sein sich schnell entwickelndes Geschäftsmodell zu unterstützen. So hat sich das Unternehmen beispielsweise beim Ausbau wichtiger Initiativen wie seinem Marktplatz, auf dem Synchronsprecher/innen und ihre Stimmen für die kommerzielle Nutzung lizenzieren können, auf Stripe gestützt.
Wir haben vor etwa zweieinhalb Jahren begonnen und sind jetzt ein Einhorn. Mittlerweile nutzen Hunderttausende von Self-Service-Abonnentinnen und -Abonnenten sowie Unternehmen wie Perplexity, Time Magazine und Bertelsmann unsere Plattform. All diese Zahlungen können dank der Einrichtung von Stripe von unserer ersten Entwicklungsfachkraft abgewickelt werden.
Unterstützung von Abonnements, Auszahlungen und Agenten-Workflows mit nur einer Entwicklungsfachkraft für die Abrechnung
ElevenLabs startete mit 11 menschenähnlichen KI-Stimmen. Im Gegensatz zu früheren robotergestützten KI-Stimmen bildet die Technologie von ElevenLabs die Nuancen von Alter, Akzent, Geschlecht, Intonation und anderen Faktoren nach, die jede menschliche Stimme einzigartig machen. Dieser Realismus, kombiniert mit der Fähigkeit der Plattform, Emotionen aus textlichen Hinweisen abzuleiten, machte die Text-to-Speech-Engine von ElevenLabs zu einem Hit bei Creator/innen, die Videoskripte, Podcasts, Nachrichten, Hörbücher und fast jede andere Art von Audio- oder Videoinhalten vertonen möchten.
ElevenLabs entschied sich für Stripe Billing, um einen einfachen Start zu ermöglichen, schnell zu iterieren und den Abonnementdienst für Voice-to-Text-Tools für Content-Creator/innen und Publisher/innen reibungslos zu skalieren. Die einfache Arbeit mit der Stripe-API und dem SDK gab dem Team das Vertrauen, in kurzer Zeit mehrere Preisstufen ohne nennenswerten technischen Aufwand entwickeln zu können. Die Flexibilität von Billing bedeutete zudem, dass das Unternehmen seine Abonnementangebote skalieren konnte, um größeren Kundinnen und Kunden gerecht zu werden, als es Produkte im Enterprise-Format wie ein vollwertiges Audioproduktionsstudio und Synchronisationsdienste auf den Markt brachte.
Mit der globalen Reichweite von Stripe konnte ElevenLabs sofort Abonnentinnen und Abonnenten aus der ganzen Welt annehmen. Das Unternehmen nutzte die Suite zur Optimierung des Bezahlvorgangs von Stripe, um eine einfache, effektive Registrierungsseite für Abonnements für seine globale Kundschaft zu gestalten. Beispielsweise bettete das Unternehmen das vorgefertigte Checkout-Formular auf seiner Seite ein, was es einfach machte, Digital Wallets und lokale Zahlungsmethoden wie Apple Pay, Google Pay und Revolut Pay ohne zusätzlichen Programmieraufwand anzubieten. ElevenLabs fügte zudem die Lösung für einen beschleunigten Bezahlvorgang von Stripe, Link, hinzu, um Kundinnen und Kunden die Möglichkeit zu geben, ihre gespeicherten Zahlungsinformationen überall im Link-Netzwerk automatisch auszufüllen. Nutzerinnen und Nutzer der Suite zur Optimierung des Bezahlvorgangs profitieren von einer Steigerung der Konversionsraten und das einfache, schnellere Bezahlvorgangerlebnis von Link macht nun 20 % der Zahlungen von ElevenLabs aus. Durch die Ausführung von Stripe auf AWS wird ElevenLabs durch integrierte KI-Tools unterstützt, um das Einkaufserlebnis für seine Kundinnen und Kunden lokal anzupassen, zu personalisieren und zu optimieren.
Als KI-Unternehmen erkannte ElevenLabs das Potenzial der KI von Stripe, das Erlebnis seiner Abonnentinnen und Abonnenten maßgeblich zu verbessern. Anstatt sich auf starre Regeln zu verlassen, bestimmen die in die Suite zur Optimierung des Bezahlvorgangs integrierten KI-Modelle dynamisch, welche Zahlungsmethoden bei jedem Bezahlvorgang in welcher Reihenfolge angezeigt werden. Dies hilft ElevenLabs dabei, eine stärker personalisierte Nutzererfahrung zu bieten.
Die Produkte von Stripe ermöglichten es ElevenLabs zudem, eine Reihe von Abrechnungs- und Zahlungsaufgaben effizient zu verwalten, wie beispielsweise die Verwaltung von Auszahlungen und die Vereinfachung des Onboarding-Prozesses. Tatsächlich hat ElevenLabs seine Stripe-Integrationen mit nur einer Entwicklungsfachkraft abgeschlossen und benötigt auch für seine verschiedenen Abrechnungs- und Zahlungs-Workflows kein weiteres Personal.
Wenn wir die gesamte Abonnementinfrastruktur intern aufbauen müssten, um all unsere unterschiedlichen Regionen abzudecken, bräuchten wir vermutlich ein komplettes Entwicklerteam, das ausschließlich für Zahlungen zuständig ist.
Als ElevenLabs eine ausgefeilte Technologie zum Klonen von Stimmen entwickelte, sah das Unternehmen eine Möglichkeit, die Community professioneller Synchronsprecher/innen zu unterstützen und seinem Geschäftsmodell eine weitere neue Ebene hinzuzufügen. Mithilfe von Stripe Connect erstellte ElevenLabs einen Marktplatz, auf dem Sprecher/innen ihre Stimmen für kommerzielle Projekte klonen, Konditionen festlegen und Auszahlungen erhalten können, wenn ein/e Nutzer/in von ElevenLabs ihre Stimme für ein Projekt auswählt. Connect bot sofort einsatzbereite Funktionen für das Onboarding von Sprecherinnen und Sprechern, einschließlich der Unterstützung internationaler Auszahlungen und der Bewältigung regulatorischer Hürden wie den KYC-Anforderungen (Know Your Customer). Die Compliance mit KYC-Vorschriften kann beispielsweise für Plattformen während des gesamten Onboarding-Prozesses eine erhebliche Hürde darstellen. Die Funktionen von Stripe sparten erneut Entwicklungszeit und Ressourcen, die ElevenLabs so für seine Kernprojekte im Bereich der Audio-KI einsetzen konnte.
ElevenLabs stellte fest, dass viele Unternehmen seine Text-to-Speech- und Speech-to-Text-Modelle nutzten, um KI-Agenten zu entwickeln. Die Unternehmen brauchten oft Monate, um in die Produktion zu gehen, und bauten denselben zugrunde liegenden Stack erneut auf. Daher brachte ElevenLabs eine eigene Plattform auf den Markt, um eine dialogorientierte KI-Stimme zu erstellen, damit Kundinnen und Kunden schneller in die Produktion gehen und sich auf den Aufbau der Agenten-Geschäftslogik anstatt auf die Infrastruktur konzentrieren können. Mit dem Agent-Toolkit von Stripe konnte die Agentenplattform von ElevenLabs Agenten in die Lage versetzen, Kundenservice- oder Vertriebs-Workflows abzuschließen. So kann beispielsweise der KI-Agent eines Unternehmens auf sein Stripe-Konto zugreifen, um eine Rückerstattung vorzunehmen oder eine Transaktion abzuwickeln, indem er einen Link zum Bezahlvorgang sendet. „Die größte Veränderung bei dialogorientierten KI-Agenten betrifft die Verschiebung von der reinen Beantwortung von Fragen hin zur Nutzung ihrer eigenen Autonomie für die Ausführung bestimmter Aktionen“, sagt Harries.
Ein Partner, der ElevenLabs den Vorsprung vor der Konkurrenz sichert
Aufbauend auf diesen ersten 11 Stimmen stehen auf der Plattform von ElevenLabs mittlerweile mehr als 5.000 Stimmen zur Verfügung – teilweise angetrieben durch die modernste Technologie seines Marktplatzes. Die Plattform hat mehr als 4 Millionen $ an Synchronsprecher/innen ausgezahlt, wobei einige der Spitzenverdiener/innen mehr als 10.000 $ pro Monat verdienen.
Die Nutzer/innen haben bereits mehr als 550.000 KI-Agenten auf der Plattform erstellt. Dies ist erst der Anfang, wenn man die Anzahl der Use Cases bedenkt, die durch wirklich dialogorientierte Bots und agentenbasierte Workflows ermöglicht werden. ElevenLabs fügt auch weiterhin neue Sprachen zu seinen Text-to-Speech- und Synchronisationsfunktionen hinzu, die nun 33 Sprachen von Englisch, Französisch und Spanisch bis hin zu neueren Ergänzungen wie Kroatisch und Tamil unterstützen.
Harries vergleicht den Wettbewerb im KI-Audio-Bereich mit der Formel 1, bei der jedes Unternehmen nach der nächsten technologischen Iteration oder dem nächsten bahnbrechenden Produkt sucht, das es an die Spitze des Feldes bringt. Infolgedessen erwartet er nicht, dass sich das Innovationstempo für ElevenLabs in absehbarer Zeit verlangsamen wird. Und er sieht Stripe als wichtigen Partner für die Fortsetzung dieser Innovation.
Ich freue mich darauf, das über Stripe abgewickelte Zahlungsvolumen weiterhin deutlich zu erhöhen, viele weitere Millionen von Auszahlungen an Synchronsprecher/innen auf unserer Plattform [vorzunehmen] und in viel mehr Länder und Zahlungsoptionen zu expandieren.