作者:鱼非
链接:https://zhuanlan.zhihu.com/p/5314248132
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

不知道大家有没有过批量获取抖音视频文案的需求。

要想批量获取抖音视频文案,没有一定的技术手段是比较麻烦,需要先获取很多的视频链接,然后去解析视频链接获取文案。

但是有了Coze之后就比较简单了,下面鱼非就带大家搭建一个Bot,通过输入关键词批量抓取抖音视频的文案,百条视频文案,也能轻轻松松抓取

Bot整体思路

该Bot的整体思路如下,循环根据关键词查询抖音视频,提取文案后保存到飞书表格中。

搭建工作流

完整工作流如下,核心功能由Coze的循环体实现。

开始节点

输入变量:

  • keyword:查询抖音视频的关键词。
  • count:提取视频的数量。
  • feishu_table_url:飞书表格的URL。

转换数组节点

该代码节点用户将提取数量转换为顺序数组,因为Coze的循环体需要数组来控制循环次数。比如输入3,则会输出[1, 2, 3]

完整代码如下:

async def main(args: Args) -> Output:
    params = args.params
    input = int(params["input"])
    output = []
    i = 1
    for i in range(1, input + 1):
        output.append(i)

    ret: Output = {
        "output": output
    }
    return ret

输入变量:

  • input:提取视频数量。

输出变量:

  • output:转换后数组的数组。

获取search_id

该节点是抖音视频插件节点,主要作用是获取search_id,用于后续循环体内的查询使用。

插件参数:

  • keyword:搜索关键词。当前节点接受开始节点的keyword输入。
  • count:搜索数量,默认为5且最大为5。当前节点设置为1。
  • sort_type:排序方式:0=综合排序;1=最多点赞;2=最新发布。当前节点设置为0。
  • publish_time:发布时间:0=不限;1=一天内;7=七天内;180=半年内。当前节点设置为7。
  • search_id:search_id是一个用于维护搜索结果连续性和去重的字符串参数。在用户首次搜索时不需要提供它,但在之后加载更多结果时,需要携带上一轮搜索返回的search_id。当前节点无需设置。
  • enable_douyin_sdk:是否接入了抖音 SDK。当前节点无需设置。

循环节点

涉及变量:

  • output:来自转换数组节点的输出数组,控制循环次数。
  • variable:来自获取search_id节点的search_id,供循环体内部使用。

get_video节点

循环体内部节点,主要作用获取视频链接等信息。

输入变量和获取search_id节点基本一致,为了重复查询视频,需要接收循环的中间变量variable作为search_id参数。

选择器节点

如果get_video节点查询到的视频为空,则提前结束循环。

LinkReaderPlugin节点

该插件节点用于读取视频内容。

输入变量:

  • url:来自get_video节点的输出的link参数。

输出变量:

  • content:提取的视频内容。

提取关键词节点

大模型节点,作用是提取视频内容的关键词信息。

完整提示词:

# 角色
你是一个高效的智能体,能够迅速从网页中提取关键词信息,为用户提供简洁准确的内容概括。

## 输出
从用户输入中提取关键词并输出,多个关键词以‘,’分割

输入变量:

  • input:来自LinkReaderPlugin节点输出的content参数。

输出变量:

  • output:提取的关键词。

调整格式节点

代码节点,调整内容格式,为后续表格插件的输入做准备。

完整代码:

async def main(args: Args) -> Output:
    params = args.params
    ret: Output = {
        "output": [[params["nickname"], params["title"], params["content"], params["link"], params["tips"]]]
    }
    return ret

输入变量:

  • nickname:来自get_video节点输出的nickname参数。
  • title:来自get_video节点输出的title参数。
  • link:来自get_video节点输出的link参数。
  • content:来自LinkReaderPlugin节点输出的content参数。
  • tips:来自提取关键词节点输出的output参数。

输出变量:

  • output:最终输出内容格式为[["{nickname}", "{title}", "{link}", "{content}", "{tips}"]]

add_rows

飞书表格插件,作用是添加数据到飞书表格中。

输入变量:

  • values:添加数据,来自调整格式节点输出的output参数。
  • length:添加数据的数量。
  • sheet_name:飞书电子表格工作表名称。
  • spreadsheet_token:飞书电子表格 token,支持输入电子表格 url。

结束节点

无需任何输出,数据已经保存在飞书表格中了。

创建Bot

创建一个Bot,设置人设与回复逻辑,以及添加搭建好的工作流。

为了使用方便,在添加一个快捷指令。

使用演示

Bot配置完成后,我们来看下使用效果如何。

00:32

效果还是挺丝滑的。


我是鱼非,专注于 AI 副业以及 AI 工具分享,更多内容可以进我的个人主页查看,欢迎来一起交流。

如果觉得文章有帮助,请帮忙点赞收藏关注一下呦~