ㅤ
成长于 21 世纪初波兰的 Mati Staniszewski 和 Piotr Dabkowski,一直无法忍受那些配音质量低劣的电影。由于为海外影片配波兰语的预算有限,因此大多数电影只有一位配音员负责为所有角色配音,几乎没有人物层次、细腻变化、情感表达可言。
这一童年感受一直影响着两人。随着他们进入科技行业,一个想法逐渐形成:如果能够创造出逼真、富有情感且能够理解语境的合成语音,是否就能解决糟糕配音的问题,甚至改变更多应用场景现状?
这一想法促成了 2022 年 ElevenLabs 的诞生。借助 AI 和深度学习领域的技术进步,ElevenLabs 成为首家能够生成类人语音(甚至笑声)的专业仿真音公司。这一突破让这家初创企业迅速跻身 AI 音频技术领域的前列。如今,ElevenLabs 已打造出丰富的产品矩阵并且不断推陈出新,包括面向音频和视频内容的文本转语音引擎、角色语音设计工具、翻译与配音工作室,以及能够与客户互动的对话式 AI 聊天机器人工具包。
随着业务快速增长,ElevenLabs 需要一家同样能力强大的支付合作伙伴来支持其产品商业化。2023 年,这家总部位于伦敦和纽约的初创企业选择与 Stripe 合作,针对音频 AI 工具推出了统一收费的订阅服务。此后,ElevenLabs 借助 Stripe 丰富的产品持续拓展企业级服务并支持其业务模式快速发展。例如,在打造配音员可以授权其声音用于商业用途的交易平台等重大项目时,Stripe 发挥了重要作用。
我们成立至今大约两年半时间,已成长为一家独角兽企业。我们拥有数十万自助订阅用户,同时还服务着 Perplexity、《时代》杂志和 Bertelsmann 等大型企业客户。而所有这些支付业务都由当初完成 Stripe 集成的那位工程师负责。
由一名计费工程师负责订阅、提现和智能体工作流
ElevenLabs 最初仅提供 11 种类人 AI 语音。与以往机械、生硬的 AI 语音不同,ElevenLabs 技术能够还原年龄、口音、性别、语调等构成每个人独特声音特征的各种细微差异。这种超逼真的语音能力,加上从文本线索中判断各种情感表达的能力,让 ElevenLabs 的文本转语音引擎迅速受到创作者欢迎。无论是视频脚本、播客、新闻报道、有声读物,还是其他任何形式的音视频内容,创作者几乎都可以借助 ElevenLabs 生成想要的语音。
ElevenLabs 选择了 Stripe Billing,以便轻松上线、持续迭代、无缝拓展面向内容创作者和出版人的语音转文本工具订阅服务。Stripe API 和 SDK 易于使用,让 ElevenLabs 团队确信,几乎无需在任务上投入工程时间,即可快速构建多个定价层级。ElevenLabs 推出功能完备的音频制作工作室和配音服务等企业级产品时,借助 Billing 的灵活性,可以提供更多订阅套餐,满足更大规模客户的语音需求。
得益于 Stripe 覆盖全球的服务,ElevenLabs 能够即刻向全球用户提供订阅服务。此外,ElevenLabs 还采用 Stripe 的结账优化套件打造面向全球用户的简洁高效订阅注册页面。例如,ElevenLabs 在页面中嵌入了预构建的 Checkout 表单,无需额外代码,即可支持 Apple Pay、Google Pay、Revolut Pay 等数字钱包和本地支付方式。ElevenLabs 还引入了 Stripe 加速结账解决方案 Link,让客户能够借助 Link 网络,在任何地方自动填充已保存的支付信息。结账优化套件能为用户显著提升转化率。Link 能够提供简单、快捷的结账体验,现在已占 ElevenLabs 支付交易的 20%。借助运行在 AWS 基础设施上的 Stripe 功能,ElevenLabs 还能使用内置 AI 工具,为客户提供本地化、个性化和优化的消费体验。
作为一家 AI 公司,ElevenLabs 看到了 Stripe AI 在提升订阅用户体验方面的巨大潜力。不同于依赖固定规则的传统方案,结账优化套件内置的 AI 模型能够动态判断每次结账时显示哪些支付方式以及按怎样的顺序显示,从而帮助 ElevenLabs 提供更个性化的用户体验。
Stripe 产品还帮助 ElevenLabs 高效管理各种计费和支付任务,例如管理提现和简化入驻流程等。事实上,ElevenLabs 仅用一名工程师便完成了所有 Stripe 集成工作,并负责管理各种计费和支付工作流。
如果要由我们自己搭建并维护覆盖全球各个市场的整个订阅基础设施,我预计需要组建一支完整的工程团队,专门负责支付板块。
开发出先进的语音克隆技术后,ElevenLabs 意识到这不仅能够服务专业配音员群体,还能为其业务模式开辟新的增长空间。借助 Stripe Connect,ElevenLabs 搭建了一个交易平台。配音员可以在平台上创建语音副本,授权用于商业项目,还可以设置授权条款,并在语音被 ElevenLabs 用户选定用于项目时获得收益。Connect 提供了即用型功能,帮助 ElevenLabs 处理配音员入驻流程,包括支持国际提现和应对客户身份验证 (KYC) 等监管要求。遵守 KYC 要求往往是平台在用户入驻过程中面临的一大挑战。而 Stripe 产品再次帮助 ElevenLabs 节省了开发时间和资源,使 ElevenLabs 能够专注于核心音频 AI 项目。
ElevenLabs 发现许多公司使用文本转语音和语音转文本模型构建 AI 智能体,而这些公司通常需要数月时间搭建生产环境,并反复构建相同的基础技术栈。因此,ElevenLabs 推出了自己的平台,帮助客户创建对话式 AI 语音,从而更快投入生产,并且专注于构建智能体业务逻辑,而无需将精力放在基础设施上。借助 Stripe 智能体工具包,ElevenLabs 的智能体平台能够让智能体开展客户服务或销售工作流。例如,企业的 AI 智能体可以访问 Stripe 账户发起退款,或通过发送结账链接完成交易。Harries 表示:“对话式 AI 智能体最大的变化将是从单纯回答问题,发展为能够自主执行具体操作。”
助力 ElevenLabs 在竞争中保持领先
在最初 11 种语音的基础上,ElevenLabs 智能体平台现已拥有超过 5000 种语音资源,其中一部分来自其先进的创作者交易平台。智能体平台已向配音员累计支付超过 400 万美元酬劳,部分头部创作者每月收入已超过 1 万美元。
如今,用户已在智能体平台上创建了超过 55 万个 AI 智能体。考虑到真正具备对话能力的机器人和智能体工作流所能覆盖的应用场景,这仅仅只是开始。ElevenLabs 还在持续扩展文本转语音和配音功能所支持的语言种类。目前平台已支持 33 种语言,涵盖英语、法语、西班牙语,以及新增的克罗地亚语和泰米尔语等语言。
Harries 将 AI 音频领域的竞争比作 F1 赛车,在这个领域中,每家公司都在寻找下一次技术迭代或突破性产品,希望借此抢占先机。因此,Harries 认为 ElevenLabs 的创新速度短期内不会放缓,而 Stripe 将继续成为推动其创新的重要合作伙伴。
我非常期待继续借助 Stripe 处理更大规模的支付交易,向平台上的配音员[发放]数以百万计的付款,并将业务拓展至更多国家/地区,支持更多支付方式。