Detrás de escena: Cómo ElevenLabs creció con Stripe hasta convertirse en un líder de audio con IA de 3 mil millones de dólares

ElevenLabs es el líder mundial en investigación y tecnología de audio con IA, que crea herramientas de audio de IA de vanguardia para empresas, desarrolladores y creadores. La plataforma permite a millones de personas y miles de empresas (incluidos empleados de más del 72 % de las 500 empresas de la lista Fortune) crear de forma rápida y asequible locuciones de alta calidad a escala y lanzar agentes de voz de IA interactivos en más de 30 idiomas.

Productos utilizados

    Billing
    Connect
    Payments
    Checkout
En todo el mundo
Startup


Mati Staniszewski y Piotr Dabkowski, criados en Polonia a principios de la década de los 2000, no podían soportar el mal doblaje de las películas que tenían que ver. El presupuesto para doblar películas extranjeras al polaco es limitado, lo que significaba que la mayoría de las películas tenían un solo orador que recitaba las líneas de cada personaje con poca profundidad, matiz o emoción.

A estos amigos se les quedaron grabadas esas experiencias de la infancia cuando hicieron carrera en el sector tecnológico y, al final, les surgió una idea: ¿y si pudieran resolver el terrible problema del doblaje, y muchos otros, creando voces sintéticas realistas, emotivas y con conciencia del contexto?

Esa idea condujo al lanzamiento en 2022 de ElevenLabs, que aprovechó los avances en IA y aprendizaje profundo para convertirse en la primera empresa en desarrollar voces artificiales capaces de crear un habla (e incluso risa) similar a la humana. Ese avance situó a la startup en la vanguardia de la tecnología de audio con IA. En la actualidad, ElevenLabs ofrece un conjunto de productos cada vez más amplio que incluye un motor de texto a voz para contenidos de audio y vídeo, herramientas de diseño de voz para el desarrollo de personajes, un estudio de traducción y doblaje y un kit de herramientas para chatbots de IA conversacional que pueden interactuar con los clientes.

La monetización de esos productos a medida que la empresa crecía requería un socio de pago igual de avanzado. ElevenLabs, establecida en Londres y Nueva York, recurrió a Stripe en 2023 con el objetivo de lanzar suscripciones de tarifa plana para sus herramientas de audio con IA. Desde entonces, ElevenLabs ha dependido de la profundidad de los productos de Stripe para expandirse a servicios de nivel empresarial y apoyar su modelo de negocio en rápida evolución. Por ejemplo, la empresa ha confiado en Stripe para desarrollar iniciativas importantes como su marketplace, donde los actores de doblaje pueden obtener licencias por sus voces para uso comercial.

Soporte para suscripciones, transferencias y flujos de trabajo con agentes con un único ingeniero de facturación

ElevenLabs comenzó con 11 voces de IA similares a las humanas. A diferencia de las voces robóticas de IA anteriores, la tecnología de ElevenLabs reproduce los matices de edad, acento, género, entonación y otros factores que hacen que cada voz humana sea única. Ese realismo, combinado con la capacidad de la plataforma para calibrar las emociones a partir de pistas textuales, hizo que el motor de texto a voz de ElevenLabs fuese un éxito entre los creadores que buscaban dar a voz a los guiones de vídeo, podcasts, noticias, audiolibros y casi cualquier otro tipo de contenido de audio o vídeo.

ElevenLabs eligió Stripe Billing para empezar fácilmente, iterar rápidamente y ampliar sin problemas su servicio de suscripción de herramientas de voz a texto para creadores de contenido y editores. La facilidad de trabajar con la API de Stripe y el SDK dio al equipo la confianza de que podían desarrollar rápidamente múltiples niveles de tarifas prácticamente sin dedicar tiempo de ingeniería a esta tarea. La flexibilidad de Billing también permitió a la empresa ampliar sus ofertas de suscripción para dar cabida a clientes más grandes a medida que lanzaba productos a escala empresarial, como un estudio de producción de audio completo y servicios de doblaje.

Con el alcance global de Stripe, ElevenLabs pudo aceptar al instante suscriptores de todo el mundo, y la empresa utilizó el paquete de optimización del checkout de Stripe para diseñar una página de registro de suscripción sencilla y eficaz para el público global. Por ejemplo, la empresa integró el formulario prediseñado de Checkout en su página, lo que facilitó la oferta de monederos digitales y métodos de pago locales, como Apple Pay, Google Pay y Revolut Pay, sin necesidad de programación adicional. ElevenLabs también añadió la solución de proceso de compra acelerado de Stripe, Link, para permitir a los clientes completar automáticamente su información de pago guardada en cualquier lugar de la red de Link. Los usuarios del paquete de optimización del checkout se benefician de un aumento en las tasas de conversión y la experiencia de proceso de compra más sencilla y rápida de Link representa ahora el 20 % de los pagos de ElevenLabs. Al ejecutar Stripe en AWS, ElevenLabs cuenta con el soporte de herramientas de IA integradas para localizar, personalizar y optimizar la experiencia de compra de sus clientes.

Como empresa de IA, ElevenLabs vio el potencial de la IA de Stripe para lograr un impacto significativo en el recorrido del suscriptor. En lugar de depender de reglas rígidas, los modelos de IA integrados en el paquete de optimización del checkout determinan de forma dinámica qué métodos de pago mostrar y en qué orden en cada proceso de compra, lo que ayuda a ElevenLabs a ofrecer una experiencia del usuario más personalizada.

Los productos de Stripe también permitieron a ElevenLabs gestionar eficazmente una serie de tareas de facturación y pago, como la gestión de transferencias y la simplificación del proceso de activación. De hecho, ElevenLabs llevó a cabo sus integraciones de Stripe y gestiona sus distintos flujos de trabajo de facturación y pago con un único ingeniero.

Cuando ElevenLabs desarrolló una sofisticada tecnología de clonación de voz, la empresa vio la oportunidad de apoyar a la comunidad de actores de doblaje profesionales y añadir otra nueva capa a su modelo de negocio. Mediante el uso de Stripe Connect, ElevenLabs creó un marketplace en el que los actores pueden clonar sus voces para proyectos comerciales, establecer condiciones y recibir transferencias cada vez que un usuario de ElevenLabs selecciona su voz para un proyecto. Connect ofreció capacidades listas para usar con el fin de gestionar el onboarding de los actores de doblaje, lo que incluye aceptar transferencias internacionales y gestionar obstáculos normativos, como los requisitos de conocimiento del cliente (KYC, por sus siglas en inglés). Por ejemplo, el cumplimiento de la normativa con las reglas de KYC puede suponer un obstáculo considerable para las plataformas a lo largo del proceso de onboarding. Las funciones de Stripe volvieron a ahorrar tiempo de desarrollo y recursos que ElevenLabs pudo dedicar a sus proyectos principales de IA de audio.

ElevenLabs observó que muchas empresas utilizaban sus modelos de texto a voz y de voz a texto para crear agentes de IA. Las empresas a menudo tardaban meses en entrar en producción y reconstruían la misma pila subyacente. Por este motivo, ElevenLabs lanzó su propia plataforma para crear una voz de IA conversacional a fin de que los clientes llegaran antes a producción y se centraran en el desarrollo de la lógica de negocio del agente, en lugar de enfocarse en la infraestructura. Con el conjunto de herramientas de agentes de Stripe, la plataforma de agentes de ElevenLabs permitió a los agentes completar flujos de trabajo de atención al cliente o de ventas. Por ejemplo, el agente de IA de una empresa podría acceder a su cuenta de Stripe para emitir un reembolso o completar una transacción mediante el envío de un enlace del proceso de compra. «El mayor cambio en los agentes de IA conversacional va a ser pasar de simplemente responder preguntas, a usar ahora su propia autonomía para ejecutar ciertas acciones», afirmó Harries.

Un socio para mantener a ElevenLabs por delante de la competencia

A partir de esas 11 primeras voces, ElevenLabs cuenta ahora con más de 5000 voces disponibles en su plataforma, impulsada en parte por su avanzado marketplace. La plataforma ha pagado más de 4 millones de dólares a actores de doblaje y algunos de los que más ganan superan los 10.000 dólares al mes.

Los usuarios ya han creado más de 550.000 agentes de IA en la plataforma, lo que es solo el principio, teniendo en cuenta el número de casos de uso que permiten los bots verdaderamente conversacionales y los flujos de trabajo de los agentes. ElevenLabs también sigue añadiendo más idiomas a sus funciones de texto a voz y doblaje, que ahora son compatibles con 33 idiomas, desde el inglés, el francés y el español hasta nuevas incorporaciones como el croata y el tamil.

Harries compara la competencia en el ámbito del audio con IA con la Fórmula 1, en la que todas las empresas buscan la próxima iteración tecnológica o el producto más innovador para situarse en primera línea. Por ello, no espera que el ritmo de innovación de ElevenLabs disminuya en un futuro próximo. También ve a Stripe como un socio clave para continuar con esa innovación.

Máxima transparencia de precios

Tarifas integradas por transacción sin comisiones ocultas

Inicia tu integración

Ponte en marcha con Stripe en tan solo 10 minutos