最强国产TTS接入MCP后,10分钟克隆哪吒2人物语音

这个五一,在外游玩的时候,路过一家玩具店,这家店分别采用哪吒,申公豹,敖丙的声音介绍不同的产品。介绍产品的时候用敖丙的声音,申公豹模拟咨询的用户,开始促单的时候,则是用哪吒的声音
每个声音代表了一种不同的气场,现场吸引了不少的小孩。
简单的语音clone技术,但确给产品带来了不一样的体验。那一刻,突然想到,现在的在线小说这么火爆,很多人不光看,也喜欢听。做一个具有clone声色的有声读物网站,应该也蛮有意思的
最近花时间捣鼓了一会后,申公豹说职场上线了!

申公豹的音色采用海螺MINIMAX的MCP完成,网站设计用的Trae。但不管是MCP的使用还是网站的生成,都是在Trae中操作的。
下面来介绍整个过程
01MiniMax MCP做声音clone
为什么选择MiniMax?
1是因为技术过硬,著名的海螺AI就是MinMax下的产品
2 在mcp.so上,我发现MiniMax的热度非常的高。已经排在第三的位置了,说明使用的人众多

配置非常方便,格式如下,需要在MiniMax的官网上去申请一个api key.

自带的tool除了可以文本转语音,语音clone,还有文本到视频,图片的功能。不过转视频的收费有点小贵。

再用Trae中来配置MiniMax的MCP,我之前介绍了很多款可以配置MCP的工具,但综合使用下来,我觉得Trae用起来是最方便的。
新增MCP的时候,选择原始配置,也就是在json文件中去配置。

原因在于,api key很长,如果把配置直接复制进去,api key会被换行。导致不能被识别为json文件格式
配置好后如下图
MINIMAX_MCP_BASE_PATH:表示语音生成后的存放路径
MINIMAX_API_RESOURCE_MODE: 表示采用本地语音文件进行clone.

显示:可使用,表示配置成功。

接下来开始测试功能,在Trae中新建一个工程,将申公豹的原声放入工程文件夹
然后要求用申公豹.mp3 来克隆一段话。

调用MiniMax的MCP后,也就1分钟多点的时间,clone完成。

在返回中,带上了clone语音的在线地址,通过这个将clone后的声音下载下来
效果和语境结合得不错,申公豹的声音真的是职场打工人用来吐槽的天选选择,听到这些配音,就能感觉出职场打工人的无奈和委屈。
02 申公豹说职场上线
我用哪吒,敖丙,申公豹的声音都clone过同一段文本,本来是想着用哪吒的音色。但听了申公豹的效果后,才意识到申公豹才是职场配音的首选。
第一步:clone声音
方法和之前的一样,不同的是,这一次换了个更长的文本


声音clone完毕,保存为mp3文件。
第二步:做网站
网站上需要显出文本,并且点击播放后,开始播放clone出来的语音

网页能顺利生成,但是播放后的语音不太对,没有声音,之前的方式是把clone音的网页链接嵌入到网站中。看起来有点问题
于是改了下,在Trae中通过File打开clone.mp3,让网页的语音直接使用clone.mp3

写在最后
我强烈推荐大家用Trae或者cursor这样的编程工具上去使用MCP。
因为这些AI编程工具,能够迅速的生成一个产品原形,同时又支持MCP。也就是给产品赋予了一个额外工具功能。
比如我这次做的这个clone音色网站,用单独其中一个工具都很难做出来。但组合后达到了1+1>2的效果。