Detrás de escena: Cómo ElevenLabs creció con Stripe hasta convertirse en una empresa líder en la creación de audio con IA, valuada en 3 mil millones de dólares

ElevenLabs es una empresa líder mundial en investigación y tecnología de audio con IA, que crea herramientas de audio de IA de vanguardia para empresas, desarrolladores y creadores. La plataforma permite a millones de personas y miles de empresas (incluidos empleados de más del 72 % de las 500 empresas de la lista Fortune) crear de forma rápida y asequible locuciones de alta calidad a escala y lanzar agentes de voz de IA interactivos en más de 30 idiomas.

Productos utilizados

    Billing
    Connect
    Payments
    Checkout
Internacional
Startup

Mati Staniszewski y Piotr Dabkowski, que crecieron en Polonia a principios de la década de los 2000, no podían soportar el mal doblaje de las películas que veían. El presupuesto para doblar películas extranjeras al polaco es limitado, lo que significaba que la mayoría de las películas tenían un solo orador que recitaba las líneas de cada personaje con poca profundidad, matiz o emoción.

Esas experiencias de la infancia se les quedaron grabadas a los dos amigos cuando iniciaron sus carreras en el sector tecnológico y, al final, les surgió una idea: ¿y si pudieran resolver el terrible problema del doblaje, y muchos otros, creando voces sintéticas realistas, emotivas y con conciencia del contexto?

Esa idea condujo al lanzamiento en 2022 de ElevenLabs, que aprovechó los avances en IA y aprendizaje profundo para convertirse en la primera empresa en desarrollar voces artificiales capaces de crear un habla (e incluso risa) similar a la humana. Ese avance situó a la startup en la vanguardia de la tecnología de audio con IA. En la actualidad, ElevenLabs ofrece un conjunto de productos cada vez más amplio que incluye un motor de texto a voz para contenidos de audio y video, herramientas de diseño de voz para el desarrollo de personajes, un estudio de traducción y doblaje, y un kit de herramientas para chatbots de IA conversacional que pueden interactuar con los clientes.

La monetización de esos productos a medida que la empresa crecía requería un socio de pago igual de avanzado. ElevenLabs, establecida en Londres y Nueva York, recurrió a Stripe en 2023 para lanzar suscripciones de tarifa plana para sus herramientas de audio con IA. Desde entonces, ElevenLabs ha aprovechado el potente ecosistema de productos de Stripe para expandirse a servicios empresariales y apoyar su modelo de negocio en rápida evolución. Por ejemplo, la empresa confió en Stripe para desarrollar iniciativas importantes como su marketplace, donde los actores de doblaje pueden obtener licencias de sus voces para uso comercial.

«Empezamos hace dos años y medio y ya somos una empresa unicornio», afirma Luke Harries, jefe de crecimiento de ElevenLabs. «Tenemos cientos de miles de suscriptores de autoservicio y empresas como Perplexity, la revista Time y Bertelsmann utilizan nuestra plataforma. Todos estos pagos los ha gestionado nuestro primer ingeniero que configuró Stripe».

Soporte de suscripciones, transferencias y flujos de trabajo agénticos con un ingeniero de cobros

ElevenLabs comenzó con 11 voces de IA similares a las humanas. A diferencia de las voces robóticas de IA anteriores, la tecnología de ElevenLabs reproduce los matices de edad, acento, género, entonación y otros factores que hacen que cada voz humana sea única. Ese realismo, combinado con la capacidad de la plataforma para calibrar las emociones a partir de pistas textuales, hizo que el motor de texto a voz de ElevenLabs fuese un éxito entre los creadores que buscaban locutar guiones de video, podcasts, noticias, audiolibros y casi cualquier otro tipo de contenido de audio o video.

ElevenLabs eligió Stripe Billing para empezar fácilmente, iterar rápidamente y hacer crecer sin inconvenientes su servicio de suscripción para herramientas de voz a texto para creadores de contenido y editores. La facilidad de trabajar con la API y el SDK de Stripe hizo que el equipo confiara en que podría crear rápidamente varios niveles de tarifas sin dedicar prácticamente tiempo de ingeniería a la tarea. La flexibilidad de Billing también permitió a la empresa ampliar sus ofertas de suscripción para dar lugar a clientes más grandes a medida que desplegaba productos a escala empresarial, como un estudio de producción de audio completo y servicios de doblaje.

Con el alcance internacional de Stripe, ElevenLabs pudo aceptar al instante suscriptores de todo el mundo, y la empresa utilizó el paquete de optimización de compra de Stripe para diseñar una página de registro de suscripciones sencilla y eficaz para el público internacional. Por ejemplo, la empresa integró el formulario prediseñado de Checkout en su página, lo que facilitó la oferta de carteras digitales y métodos de pago locales como Apple Pay, Google Pay y Revolut Pay sin más necesidad de programación. ElevenLabs también agregó la solución de proceso de compra acelerado de Stripe, Link, para permitir a los clientes completar automáticamente su información de pago guardada en cualquier lugar de la red Link. Los usuarios del paquete de optimización de compra se benefician de un aumento de las tasas de conversión, y la experiencia del proceso de compra de Link más fácil y rápido representa ahora el 20 % de los pagos de ElevenLabs.

Como empresa de IA, ElevenLabs vio el potencial de la IA de Stripe para tener un impacto significativo en el recorrido del suscriptor. En lugar de depender de reglas rígidas, los modelos de IA integrados en el paquete de optimización de compra determinan dinámicamente qué métodos de pago mostrar y en qué orden en cada proceso de compra, lo que ayuda a ElevenLabs a ofrecer una experiencia del usuario más personalizada.

Los productos de Stripe también permitieron a ElevenLabs gestionar eficazmente una serie de tareas de cobro y pago, como la gestión de las transferencias y la simplificación del proceso de onboarding. De hecho, ElevenLabs logró sus integraciones de Stripe y está gestionando sus diversos flujos de trabajo de cobro y pago con un solo ingeniero. «Si tuviéramos que realizar toda la infraestructura de suscripción internamente para gestionar nuestras diferentes regiones geográficas, necesitaríamos un equipo de ingeniería completo dedicado exclusivamente a los pagos», afirma Harries.

Cuando ElevenLabs desarrolló una sofisticada tecnología de clonación de voces, la empresa vio la oportunidad de apoyar a la comunidad de actores de doblaje profesionales y agregar un nuevo nivel a su modelo de negocio. Con Stripe Connect, ElevenLabs creó un marketplace en el que los actores pueden clonar sus voces para proyectos comerciales, establecer condiciones y recibir transferencias cada vez que un usuario de ElevenLabs elige su voz para un proyecto. Connect ofrecía funcionalidades listas para usar para gestionar el onboarding de actores de doblaje, incluido el soporte de transferencias internacionales y la gestión de obstáculos normativos como los requisitos de «Conozca a su cliente» (KYC). Por ejemplo, el cumplimiento de las normativas KYC puede suponer un obstáculo considerable para las plataformas a lo largo del proceso de onboarding. Las funcionalidades de Stripe volvieron a ahorrar tiempo de desarrollo y recursos que ElevenLabs pudo dedicar a sus principales proyectos de IA de audio.

ElevenLabs vio que muchas empresas utilizaban sus modelos de texto a voz y voz a texto para crear agentes de IA. A menudo, las empresas tardaban meses en entrar en producción y reconstruían la misma pila de software subyacente. Así que ElevenLabs lanzó su propia plataforma para crear una voz de IA conversacional para que los clientes pudieran entrar en producción con mayor rapidez y centrarse en construir la lógica de negocio del agente en lugar de la infraestructura. Con el kit de herramientas de agente de Stripe, la plataforma de ElevenLabs podría permitir a los agentes completar los flujos de trabajo de atención al cliente o ventas. Por ejemplo, el agente de IA de una empresa podría acceder a su cuenta de Stripe para emitir un reembolso o completar una transacción enviando un enlace de finalización de compra. «El mayor cambio en los agentes conversacionales de IA va a ser el paso de la mera respuesta a preguntas al uso de su propia autonomía para ejecutar determinadas acciones», afirma Harries.

Un socio para mantener a ElevenLabs por delante de la competencia

A partir de esas 11 primeras voces, ElevenLabs cuenta ahora con más de 5000 voces disponibles en su plataforma, impulsada en parte por su avanzado marketplace. La plataforma ha pagado más de 4 millones de dólares estadounidenses a actores de doblaje, y algunos de los que más ganan superan los USD 10,000 al mes.

Los usuarios ya crearon más de 550,000 agentes de IA en la plataforma, lo que es solo el principio, teniendo en cuenta el número de casos de uso que permiten los bots verdaderamente conversacionales y los flujos de trabajo de los agentes. ElevenLabs también sigue agregando más idiomas a sus funcionalidades de texto a voz y doblaje, que ahora son compatibles con 33 idiomas, desde el inglés, el francés y el español hasta nuevas incorporaciones como el croata y el tamil.

Harries compara la competencia en el ámbito del audio con IA con la Fórmula 1, en donde todas las empresas buscan la próxima iteración tecnológica o el producto más innovador para situarse en primera línea. Por ello, no espera que el ritmo de innovación de ElevenLabs disminuya en un futuro próximo. Además, ve a Stripe como un socio clave para continuar esa innovación.

«Me entusiasma seguir escalando un volumen mucho mayor de pagos a través de Stripe, [realizando] muchos más millones de pagos a actores de doblaje en nuestra plataforma, y expandiéndonos a muchos más países y opciones de pago», dijo Harries.

Cuentas claras y transparentes

Precios integrados por transacción sin comisiones ocultas

Inicia tu integración

Ponte en marcha con Stripe en solo 10 minutos