背景

开源方案MoneyPrinterTurbo最近比较火,这是一个利用大模型,一键生成短视频的项目,在GitHub上有很多star,基于兴趣对该开源项目做了一个调研。

地址:github.com/harry0703/Mo

效果

主题:春天天气很好,适合出去游玩

生成视频:

重新播放

技术架构

整体架构

视频生成流程

前端页面

API接口

一个实操的案例

输入参数

文案扩写

生成搜索词

生成文案的音频和字幕

搜索视频素材

下载视频素材

纯视频合成

视频+音频+字幕合成

加入bgm

最终视频

01:22

评价

优点

实现了基于主题的一键成片,可以实现批量生成剪辑视频

缺点

  • 文本和视频的匹配为随机匹配,没有镜头匹配的机制
  • 没有视频转场功能
  • 没有素材库,不可以使用自己的素材
  • 等等

说实话,这种视频生成之后不太清楚受众人群是谁,因为文本和视频的匹配度较差,个人对这种视频不太感冒。

不过,该开源方案会继续保持迭代,后续会有不少优化,保持关注吧