一个开源的免费AI语音克隆:OpenVoice[1]

OpenVoice 是 MyShell 公司出品的一个免费开源项目,一种多功能的语音克隆方法,只需从参考说话者获取一个简短的音频剪辑即可复制他们的声音,并生成多种语言的语音。

MyShell 公司是一个基于opBNB的Web3+AI平台的公司,致力于打造开放的AI原生应用平台。

目前在GitHub上[2]开源,关键字:myshell-ai/OpenVoice,已经有17.3k个star⭐️,项目还是很活跃的,近一个星期都有更新,主要开发语言是Python。

主要特点:

1. 准确的音色克隆:能够准确地克隆参考音色,并以多种语言和口音生成语音。
1. 灵活的语音风格控制:可以对语音风格进行细粒度控制,包括情绪、口音、节奏、停顿和语调,同时还可以复制参考说话者的音色。
2. 零样本跨语言语音克隆:无论是生成的语音的语言还是参考语音的语言,都不需要在大规模多语言训练数据集中出现。

根据其GitHub页面介绍,自2024年4月起,V2和V1均在MIT许可证下发布,可免费用于商业用途。

除了开源代码,项目中还有这个项目的论文,以及一些示例语音展示,可以点击试听。

这个就是论文[3],可直接查看。