Nos bastidores: como a ElevenLabs tornou-se uma líder de US$ 3 bi em áudio de IA com a Stripe

A ElevenLabs é líder global em pesquisa e tecnologias para áudio com IA, criando ferramentas de ponta para áudio com IA para empresas, desenvolvedores e criadores. A plataforma permite que milhões de usuários e milhares de empresas, inclusive funcionários de mais de 72% das empresas Fortune 500, criem dublagens e narrações ou lancem agentes de atendimento com voz rapidamente, de forma acessível, em mais de 30 idiomas.

Produtos usados

    Billing
    Connect
    Payments
    Checkout
Global
Startup


Ao crescer na Polônia no início dos anos 2000, Mati Staniszewski e Piotr Dabkowski não suportavam os filmes mal dublados que precisavam assistir. Havia um orçamento limitado para a dublagem de filmes estrangeiros para o polonês, o que significava que a maioria dos filmes contava com apenas uma pessoa narrando as falas de todos os personagens, com pouca profundidade, nuance ou emoção.

Essas experiências da infância permaneceram com os amigos ao longo de suas carreiras no setor de tecnologia e acabaram inspirando uma ideia: e se eles pudessem resolver o problema das dublagens ruins, e muitos outros, criando vozes sintetizadas realistas, emocionais e sensíveis ao contexto?

Essa ideia levou ao lançamento da ElevenLabs em 2022. Aproveitando os avanços em IA e aprendizado profundo, a empresa se tornou a primeira a desenvolver vozes artificiais capazes de produzir fala semelhante à humana, inclusive risadas. Esse avanço colocou a startup na vanguarda da tecnologia de áudio com IA. Hoje, a ElevenLabs oferece um conjunto crescente de produtos que inclui um mecanismo de conversão de texto em fala para conteúdos de áudio e vídeo, ferramentas de criação de vozes para desenvolvimento de personagens, um estúdio de tradução e dublagem e um kit de ferramentas para chatbots de comércio agêntico que podem interagir com clientes.

Monetizar esses produtos à medida que a empresa crescia exigia um parceiro de pagamentos igualmente avançado. Com sede em Londres e Nova York, a ElevenLabs recorreu à Stripe em 2023 para lançar assinaturas com preço fixo para suas ferramentas de áudio com IA. Desde então, a empresa tem contado com a profundidade do portfólio de produtos da Stripe para expandir para serviços corporativos e dar suporte ao seu modelo de negócios em rápida evolução. Por exemplo, a ElevenLabs tem utilizado a Stripe enquanto desenvolve iniciativas importantes, como seu marketplace, onde atores de voz podem licenciar suas vozes para uso comercial.

Suporte a assinaturas, repasses e fluxos de trabalho agênticos com um único engenheiro de faturamento

A ElevenLabs começou com 11 vozes de IA semelhantes às humanas. Diferentemente das vozes robóticas de IA anteriores, a tecnologia da ElevenLabs reproduz nuances de idade, sotaque, gênero, entonação e outros fatores que tornam cada voz humana única. Esse realismo, combinado com a capacidade da plataforma de interpretar emoções a partir de pistas textuais, transformou o mecanismo de conversão de texto em fala da ElevenLabs em um sucesso entre criadores que buscavam dar voz a roteiros de vídeo, podcasts, reportagens, audiolivros e praticamente qualquer outro tipo de conteúdo de áudio ou vídeo.

A ElevenLabs escolheu o Stripe Billing para começar rapidamente, iterar com agilidade e expandir sem dificuldades seu serviço de assinatura para ferramentas de conversão de voz em texto destinadas a criadores de conteúdo e editoras. A facilidade de trabalhar com a API e os SDKs da Stripe deu à equipe a confiança de que poderia criar rapidamente vários níveis de preços praticamente sem dedicar tempo de engenharia à tarefa. A flexibilidade do Billing também permitiu que a empresa ampliasse suas ofertas de assinatura para atender clientes maiores à medida que lançava produtos corporativos, como um estúdio completo de produção de áudio e serviços de dublagem.

Com o alcance global da Stripe, a ElevenLabs pôde aceitar assinantes instantaneamente de todo o mundo, e utilizou o Pacote de Otimização de Checkout da Stripe para criar uma página de cadastro de assinaturas simples e eficaz para esse público global. Por exemplo, a empresa incorporou o formulário pré-construído Checkout em sua página, o que facilitou a oferta de carteiras digitais e formas de pagamento locais, como Apple Pay, Google Pay e Revolut Pay, sem necessidade de programação adicional. A ElevenLabs também adicionou o Link, a solução de checkout acelerado da Stripe, permitindo que os clientes preencham automaticamente suas informações de pagamento salvas em qualquer lugar da rede Link. Usuários do Pacote de Otimização de Checkout se beneficiam de um aumento nas taxas de conversão, e a experiência de checkout mais rápida e simples da Link já responde por 20% dos pagamentos da ElevenLabs. Ao executar a Stripe na AWS, a empresa conta com ferramentas de IA integradas para traduzir, personalizar e otimizar a experiência de compra dos clientes.

Como empresa de IA, a ElevenLabs identificou o potencial da inteligência artificial da Stripe para causar um impacto significativo na jornada dos assinantes. Em vez de depender de regras rígidas, os modelos de IA incorporados ao Pacote de Otimização de Checkout determinam dinamicamente quais formas de pagamento exibir e em que ordem para cada checkout, ajudando a ElevenLabs a oferecer uma experiência do usuário mais personalizada.

Os produtos da Stripe também permitiram que a ElevenLabs gerenciasse com eficiência diversas tarefas de faturamento e pagamento, como administrar repasses e simplificar o processo de onboarding. Na prática, a empresa realizou todas as integrações com a Stripe e administra seus diferentes fluxos de cobrança e pagamento com apenas um engenheiro.

Quando a ElevenLabs desenvolveu uma sofisticada tecnologia de clonagem de voz, a empresa identificou uma oportunidade de apoiar a comunidade profissional de dubladores e adicionar uma nova camada ao seu modelo de negócios. Utilizando o Stripe Connect, a ElevenLabs criou um marketplace onde atores podem clonar suas vozes para projetos comerciais, definir termos de uso e receber repasses sempre que um usuário da ElevenLabs selecionar sua voz para um projeto. O Connect ofereceu recursos prontos para uso para gerenciar o onboarding dos atores de voz, incluindo suporte a repasses internacionais e gerenciamento de exigências regulatórias, como os requisitos de Conheça Seu Cliente (KYC). Por exemplo, a conformidade com as regras de KYC pode representar um obstáculo considerável para plataformas durante o processo de onboarding. Mais uma vez, os recursos da Stripe economizaram tempo e recursos de desenvolvimento que a ElevenLabs pôde direcionar aos seus principais projetos de áudio com IA.

A ElevenLabs percebeu que muitas empresas estavam usando seus modelos Text to Speech e Speech to Text para criar agentes de IA. Essas empresas frequentemente levavam meses para colocar seus produtos em produção e acabavam reconstruindo a mesma infraestrutura básica. Por isso, a ElevenLabs lançou sua própria plataforma para criar uma voz de IA Conversacional, permitindo que os clientes chegassem à produção mais rapidamente e se concentrassem na lógica de negócios dos agentes, em vez da infraestrutura. Com o kit de ferramentas para agentes da Stripe, a plataforma de agentes da ElevenLabs passou a permitir que agentes concluíssem fluxos de trabalho de atendimento ao cliente ou vendas. Por exemplo, o agente de IA de uma empresa pode acessar sua conta Stripe para emitir um reembolso ou concluir uma transação enviando um link de checkout. “A maior mudança nos agentes de IA conversacional será deixar de apenas responder perguntas para passar a utilizar sua própria autonomia para executar determinadas ações”, afirmou Harries.

Um parceiro para manter a ElevenLabs à frente da concorrência

Partindo daquelas 11 vozes iniciais, a ElevenLabs agora disponibiliza mais de 5.000 vozes em sua plataforma, impulsionadas em parte pelo seu marketplace avançado. A plataforma já distribuiu mais de US$ 4 milhões para atores de voz, com alguns dos maiores beneficiários recebendo mais de US$ 10.000 por mês.

Os usuários já criaram mais de 550.000 agentes de IA na plataforma, o que representa apenas o começo, considerando a quantidade de casos de uso viabilizados por bots verdadeiramente conversacionais e fluxos de trabalho agênticos. A ElevenLabs também continua expandindo os idiomas compatíveis com seus recursos de Text to Speech e dublagem, que atualmente oferecem suporte a 33 idiomas, incluindo inglês, francês e espanhol, além de adições mais recentes, como croata e tâmil.

Harries compara a concorrência no setor de áudio com IA à Fórmula 1, em que todas as empresas buscam a próxima evolução tecnológica ou produto inovador que as coloque na liderança. Por isso, ele não acredita que o ritmo de inovação da ElevenLabs diminuirá tão cedo. E vê a Stripe como uma parceira fundamental para sustentar essa inovação.

Transparência total

Modelo de preços por transação integrado, sem tarifas ocultas.

Integração rápida

Comece a usar a Stripe em apenas 10 minutos.