Durante a infância na Polônia no início dos anos 2000, Mati Staniszewski e Piotr Dabkowski não suportavam os filmes mal dublados que eram obrigados a assistir. O orçamento de dublagem de filmes estrangeiros era limitado: a maioria dos filmes tinha apenas um narrador que recitava as falas de todos os personagens, com pouca profundidade, nuance ou emoção.
Essas experiências de infância acompanharam os amigos em sua carreira no setor de tecnologia e, um dia, deram origem a uma ideia: e se eles pudessem resolver o terrível problema de dublagem – e muitos outros – criando vozes sintetizadas realistas, emotivas e com consciência de contexto?
Com essa ideia, eles lançaram em 2022 a ElevenLabs, usando os avanços da IA e deep learning para criar a primeira empresa a gerar vozes artificiais capazes de criar fala humana (e até risos). Com essa inovação, a startup foi pioneira na tecnologia de áudio por IA. Hoje, a ElevenLabs oferece cada vez mais produtos, inclusive um sistema de conversão de texto em fala para conteúdos de áudio e vídeo, ferramentas de design de voz para desenvolvimento de personagens, um estúdio de tradução e dublagem e um kit para chatbots de IA que podem interagir com os clientes.
Para monetizar esses produtos à medida que a empresa se expandia, era necessário encontrar um parceiro de pagamentos avançado. Sediada em Londres e Nova York, a ElevenLabs recorreu à Stripe em 2023 para lançar assinaturas de valor fixo para suas ferramentas de IA de áudio. Desde então, a ElevenLabs já usou diversos produtos da Stripe para lançar serviços de nível empresarial e apoiar seu modelo de negócios em rápida evolução. Por exemplo, a Stripe foi parceira em iniciativas importantes, como um marketplace onde dubladores podem licenciar suas vozes para uso comercial.
“Começamos há cerca de dois anos e meio e já somos um unicórnio. Temos centenas de milhares de assinantes em autoatendimento e empresas como Perplexity, Time magazine e Bertelsmann usam a plataforma. Todos esses pagamentos foram gerenciados pelo nosso primeiro engenheiro que configurou a Stripe," comemora Luke Harries, diretor de crescimento da ElevenLabs.
Assinaturas, repasses e fluxos de trabalho para agentes com um engenheiro de cobrança
A ElevenLabs começou com 11 vozes de IA humanizadas. Ao contrário das primeiras vozes de IA, que eram robóticas, a tecnologia replica nuances de idade, sotaque, sexo, entonação e outros fatores que tornam cada voz humana única. Com esse realismo e a capacidade de avaliar emoções a partir de pistas textuais, o mecanismo de conversão de texto em fala da ElevenLabs fez sucesso entre criadores que queriam dublar scripts de vídeo, podcasts, reportagens, audiolivros e qualquer tipo de conteúdo de áudio ou vídeo.
A ElevenLabs escolheu o Stripe Billing para começar, criar alternativas rapidamente e otimizar a expansão das assinaturas de ferramentas de conversão de voz em texto para criadores e editores de conteúdo. A simplicidade da API e do SDK da Stripe fez a equipe perceber que poderia criar rapidamente vários níveis de preços, praticamente sem gastar mais tempo de desenvolvimento. A flexibilidade do Billing também permitiu otimizar as assinaturas para clientes maiores, com lançamentos de produtos em escala empresarial, como um estúdio completo de produção de áudio e serviços de dublagem.
Com o alcance global da Stripe, a ElevenLabs consegue aceitar assinantes instantaneamente de todo o mundo, usando o Pacote de Otimização de Checkout da Stripe para criar uma página de inscrição simples e eficaz para o público global. Por exemplo, a empresa incorporou o formulário do Checkout à página, com carteiras digitais e formas de pagamento regionais como Apple Pay, Google Pay e Revolut Pay, sem trabalho de desenvolvimento. Também adicionou a solução de checkout acelerado da Stripe, o Link, que preenche automaticamente os dados de pagamentos salvos do cliente em qualquer lugar da rede Link. Os usuários do Pacote de Otimização de Checkout constatam aumento de conversão, e a experiência de checkout fácil e rápida do Link já responde por 20% dos pagamentos da ElevenLabs.
Como empresa de IA, a ElevenLabs viu o potencial da IA da Stripe para a jornada do assinante. Em vez aplicar regras rígidas, os modelos de IA integrados ao Pacote de Otimização de Checkout determinam dinamicamente as formas de pagamento a serem exibidas e sua ordem, em cada finalização de compra, personalizando a experiência oferecida pela ElevenLabs.
Os produtos da Stripe também permitiram à empresa lidar com uma série de tarefas de faturamento e pagamento, como gerenciar repasses e simplificar o processo de onboarding. Na verdade, a ElevenLabs fez todas as integrações da Stripe e gerencia seus diversos fluxos de faturamento e pagamento com apenas um engenheiro. "Se tivéssemos que criar toda a infraestrutura de assinatura internamente para todas as regiões geográficas, imagino que precisaríamos de uma equipe de engenharia completa dedicada exclusivamente a pagamentos", diz Harries.
Com sua tecnologia sofisticada de clonagem de voz, a ElevenLabs viu uma oportunidade de apoiar a comunidade profissional de dubladores e adicionar mais um serviço ao seu modelo de negócios. Com o Stripe Connect, a empresa criou um marketplace onde os dubladores podem clonar suas vozes para projetos comerciais, definir termos e receber pagamentos sempre que um usuário da ElevenLabs selecionar sua voz para um projeto. O Connect trouxe recursos prontos para uso para gerenciar a integração de dubladores, repasses internacionais e gestão de questões regulatórias, como os requisitos de Conheça Seu Cliente (KYC). Por exemplo, a conformidade com as regras de KYC pode ser um obstáculo considerável para plataformas em todo o processo de integração. Os recursos da Stripe novamente economizaram tempo e recursos que a ElevenLabs pôde dedicar aos seus principais projetos de IA de áudio.
A ElevenLabs observou que muitas empresas utilizavam seus modelos de conversão de texto em fala e conversão de fala em texto para desenvolver agentes de IA. Elas levavam meses para entrar em produção e repetiam o processo usando as mesmas estruturas. A ElevenLabs lançou a própria plataforma para criar uma voz de IA conversacional para que os clientes acelerem a produção e possam concentrar-se na lógica de negócios do agente, em vez da infraestrutura. Com o kit de ferramentas para agentes da Stripe, a plataforma de agentes da ElevenLabs permitiu que os agentes concluíssem os fluxos de trabalho de atendimento ao cliente ou de vendas. Por exemplo, o agente de IA de uma empresa pode acessar sua conta Stripe para emitir um reembolso ou concluir uma transação enviando um link de checkout. “A maior mudança nos agentes de IA conversacionais é que em vez de apenas responder perguntas, eles terão autonomia para executar certas ações”, explica Harries.
Um parceiro para manter a ElevenLabs à frente da concorrência
Tendo começado com 11 vozes, a ElevenLabs agora conta com mais de 5.000 vozes disponíveis na plataforma, em parte resultado do seu marketplace avançado. A plataforma já pagou mais de US$ 4 milhões a dubladores, e alguns dos mais bem pagos recebem mais de US$ 10.000 por mês.
Os usuários já criaram mais de 550.000 agentes de IA na plataforma e isso é só o começo, considerando o número de casos de uso possibilitados por bots verdadeiramente conversacionais e fluxos de trabalho com agentes. A ElevenLabs também continua adicionando mais idiomas aos seus recursos de conversão de texto em fala e dublagem, que agora funcionam em 33 idiomas, como inglês, francês e espanhol e que agora contam com novas opções, como croata e tâmil.
Harries compara a concorrência no setor de áudio com IA à Fórmula 1, onde todas as empresas buscam a próxima novidade tecnológica ou produto inovador para chegar à liderança. Por isso, ele não espera que o ritmo de inovação da ElevenLabs diminua tão cedo. Para ele, a Stripe será parceira fundamental na continuidade dessa inovação.
“Estou animado para continuar aumentando o volume de pagamentos com a Stripe, fazendo pagamentos de muitos milhões para dubladores em nossa plataforma e expandindo para muito mais países e opções de pagamento”, concluir Harries.