Cresciuti in Polonia nei primi anni Duemila, Mati Staniszewski e Piotr Dabkowski non riuscivano a sopportare i film mal doppiati che guardavano. Il budget per il doppiaggio dei film stranieri in polacco era scarso, pertanto la maggior parte dei film prevedeva un solo doppiatore che recitava le battute di tutti i personaggi con poca profondità, scarse sfumature e quasi nessuna emozione.
Queste esperienze d'infanzia sono rimaste impresse nei due amici, anche mentre facevano carriera nel settore tecnologico, e alla fine hanno dato vita a un'idea: risolvere il problema del doppiaggio, insieme a tanti altri, creando voci tramite sintesi vocale che fossero realistiche, commoventi e basate sul contesto.
Questa idea ha portato nel 2022 al lancio di ElevenLabs, che ha sfruttato i progressi in ambito IA e deep learning per diventare la prima azienda a creare voci artificiali capaci di generare un parlato simile a quello umano e persino le risate. Questa svolta ha dato alla start-up un reale vantaggio competitivo nelle tecnologie audio basate sull'IA. Oggi ElevenLabs offre una suite di prodotti in continua espansione che include un motore text-to-speech per contenuti audio e video, strumenti di progettazione vocale per lo sviluppo dei personaggi, uno studio di traduzione e di doppiaggio e un kit di strumenti per i chatbot IA conversazionali in grado di interagire con i clienti.
Monetizzare questi prodotti durante la crescita dell'azienda richiedeva un partner per i pagamenti altrettanto avanzato. ElevenLabs, con sede a Londra e a New York, si è affidata a Stripe nel 2023 per lanciare gli abbonamenti a tariffa fissa per i propri strumenti audio basati su IA. Da allora ElevenLabs si è basata sull’ampiezza dell'offerta Stripe per espandersi nei servizi di livello enterprise e supportare il proprio modello di business a rapida evoluzione. Ad esempio, l'azienda ha scelto Stirpe per realizzare iniziative strategiche come il suo marketplace, in cui i doppiatori possono concedere in licenza la propria voce per l'uso commerciale.
"Abbiamo iniziato circa due anni e mezzo fa e ora siamo un unicorno", ha dichiarato Luke Harries, Responsabile della crescita presso ElevenLabs. "Abbiamo centinaia di migliaia di abbonati e imprese self-service, come Perplexity, Time magazine e Bertelsmann, che usano la nostra piattaforma. Tutti questi pagamenti sono stati gestiti dal nostro primo tecnico che si è occupato di configurare Stripe".
Supporto di abbonamenti, bonifici e flussi di lavoro agentici con un solo tecnico addetto agli addebiti
ElevenLabs ha iniziato con 11 voci artificiali simili a quelle umane. A differenza delle precedenti voci robotiche generate dall'IA, la tecnologia di ElevenLabs riproduce le sfumature legate a età, accento, genere, intonazione e altri fattori che rendono unica ogni voce umana. Questo realismo, combinato alla capacità della piattaforma di calibrare le emozioni a partire da indizi testuali, ha reso il motore di sintesi vocale di ElevenLabs molto apprezzato tra i creator che desiderano dare voce a script video, podcast, notiziari, audiolibri e quasi ogni tipo di contenuti audio o video.
ElevenLabs ha scelto Stripe Billing per iniziare senza difficoltà, iterare rapidamente e adattare in modo fluido il proprio servizio in abbonamento agli strumenti di riconoscimento vocale per creatori di contenuti. La facilità di utilizzo dell'API e dell'SDK di Stripe ha dato al team la fiducia di poter sviluppare rapidamente diversi livelli tariffari dedicando praticamente zero tempo di ingegneria a questo compito. La flessibilità di Billing, inoltre, ha permesso all'azienda di ampliare la propria offerta di abbonamenti per accogliere clienti più grandi, lanciando prodotti di livello enterprise come uno studio di produzione audio completo e servizi di doppiaggio.
Grazie alla portata globale di Stripe, ElevenLabs ha potuto accettare istantaneamente abbonati di ogni parte del mondo, utilizzando la suite di ottimizzazione dei pagamenti di Stripe per progettare una pagina di iscrizione agli abbonamenti semplice ed efficace per il pubblico globale. Ad esempio, l'azienda ha implementato il modulo preintegrato di Checkout nella pagina, semplificando l'offerta di wallet e di altri metodi di pagamento locali come Apple Pay, Google Pay e Revolut Pay senza necessità di codice aggiuntivo. ElevenLabs si è inoltre affidata alla soluzione per pagamenti accelerati di Stripe, Link, per permettere ai clienti di compilare automaticamente i dati di pagamento salvati ovunque nel circuito Link. Gli utenti della suite di ottimizzazione dei pagamenti hanno beneficiato dell'aumento dei tassi di conversione e l'esperienza di pagamento rapida e semplice offerta da Link rappresenta ora il 20% di tutti i pagamenti di ElevenLabs.
In qualità di azienda specializzata in intelligenza artificiale, ElevenLabs ha riconosciuto il potenziale dell'IA di Stripe nel migliorare significativamente l'esperienza degli abbonati. Invece di affidarsi a regole rigide, i modelli di IA integrati nella suite di ottimizzazione dei pagamenti determinano in modo dinamico quali metodi di pagamento proporre e in quale ordine per ogni checkout, aiutando ElevenLabs a offrire un'esperienza utente più personalizzata.
I prodotti di Stripe hanno inoltre permesso a ElevenLabs di gestire in modo efficiente una serie di attività di addebito e pagamento, ad esempio la gestione dei bonifici e la semplificazione della procedura di attivazione. Di fatto, ElevenLabs ha completato le integrazioni Stripe e sta gestendo i vari flussi di lavoro di addebito e pagamento con un solo tecnico a disposizione. "Se dovessimo sviluppare l'intera infrastruttura di abbonamento internamente per gestire tutte le aree geografiche cui ci rivolgiamo, avremmo bisogno di un intero team di tecnici dedicato solo ai pagamenti", ha dichiarato Harries.
Quando ElevenLabs ha sviluppato una sofisticata tecnologia di clonazione vocale, l'azienda ha colto l'opportunità di supportare la community di doppiatori professionisti e di aggiungere un nuovo livello al proprio modello di business. Grazie a Stripe Connect, ElevenLabs ha creato un marketplace in cui gli attori possono clonare le proprie voci per progetti commerciali, stabilire i termini e ricevere bonifici ogni volta che un utente di ElevenLabs seleziona la sua voce per un progetto. Connect ha messo a disposizione funzionalità pronte all'uso per gestire l'attivazione degli attori e persino supportare i bonifici internazionali e gestire le complessità normative come i requisiti di adeguata verifica della clientela. Ad esempio, la conformità alle regole KYC può rappresentare un ostacolo significativo per le piattaforme nell'intera procedura di attivazione. Le funzioni di Stripe hanno fatto risparmiare all'azienda tempo e risorse di sviluppo che ElevenLabs ha potuto dedicare ai suoi progetti principali di IA audio.
ElevenLabs ha visto che molte aziende utilizzavano i suoi modelli di sintesi vocale e riconoscimento vocale per creare agenti IA. Le aziende spesso impiegavano mesi per avviare la produzione ricostruendo ogni volta lo stesso stack di base. Perciò ElevenLabs ha lanciato la propria piattaforma per creare una voce conversazionale IA con l'obiettivo di accelerare l'ingresso in produzione e permettere ai clienti di concentrarsi sulla logica dell'agente, anziché sull'infrastruttura. Grazie al kit di strumenti per agenti di Stripe, la piattaforma per agenti di ElevenLabs ha permesso agli agenti di completare flussi di lavoro legati all'assistenza clienti o alle vendite. Ad esempio, un agente IA di un'attività può accedere al proprio account Stripe per emettere un rimborso o completare una transazione inviando un link di pagamento. "Il cambiamento più significativo negli agenti conversazionali basati su IA sarà il passaggio dalla semplice risposta a domande all'autonomia nell'eseguire azioni concrete", ha dichiarato Harries.
Un partner grazie al quale ElevenLabs può sbaragliare la concorrenza
A partire da quelle prime 11 voci, ElevenLabs ne ha create oltre 5.000 che sono disponibili sulla sua piattaforma, grazie anche al suo avanzato marketplace. La piattaforma ha corrisposto oltre 4 milioni di dollari ai doppiatori, i più richiesti dei quali realizzano oltre 10.000 $ al mese.
Gli utenti hanno già creato oltre 550.000 agenti IA sulla piattaforma, un numero destinato a crescere considerando il numero di casi d'uso permessi dai flussi di lavoro con bot conversazionali e agentici. ElevenLabs continua ad aggiungere altre lingue alle funzionalità di sintesi vocale e doppiaggio e ora supporta 33 lingue, fra cui inglese, francese e spagnolo fino a lingue più recenti come il croato e il tamil.
Harries paragona la competizione nel mercato audio IA alla Formula 1, dove ogni azienda cerca la prossima iterazione tecnologica o un nuovo prodotto rivoluzionario che possa portarla in testa. Come risultato, non si aspetta che il ritmo dell'innovazione rallenti a breve per ElevenLabs. Inoltre, considera Stripe un partner strategico per continuare sulla strada a innovare.
"Sono entusiasta all'idea di aumentare il volume dei pagamenti elaborati tramite Stripe, [effettuare] molti altri milioni di pagamenti ai doppiatori presenti sulla nostra piattaforma ed espanderci in molti altri Paesi con ulteriori opzioni di pagamento", ha detto Harries.