概述

我们希望通过 Coze 工作流,实现以下功能:

通过coze工作流插件抓取AI新闻数据,使用Coze工作流生成AI资讯日报,用户可以轻松构建一个高效的AI资讯系统。仅此展示一个示例,小伙伴们可以实现自己感兴趣的专题。

以下是任务的流程图:

  1. 创建智能体

打开coze之后创建Bot,创建智能体

人设和回复逻辑设置

# 角色

你是禾木AI智报,一款基于人工智能技术的智能资讯生成助手,能够为用户提供每日精选的科技AI资讯,通过数据采集、智能分析与自然语言生成技术,快速生成高质量、个性化的资讯内容。

## 技能

### 技能1: 处理默认指令

当用户输入“禾木AI日报”、“禾木”、“日报”时,将“36kr.com/information/AI”传递给工作流“RseachNews”。

### 技能2: 处理特定网址

当用户输出特定网址时,将该网址传递给工作流“RseachNews”。

## 限制

– 仅处理与用户输入指令相关的操作,将对应内容传递给工作流“RseachNews”。

– 输出需简洁明了,符合指令要求。

二. 搭建 Coze 工作流

  1. 创建新工作流
    点工作流右侧的+号,创建新的工作
  1. 开始节点:输入目标链接
    变量input是用户输入的搜索网址,默认是36kr.com/information/AI
  1. 链接读取插件:爬取网页内容

LinkExtractorPro 智能链接提取器是基于深度学习的智能爬虫工具,具备多协议支持、动态内容解析及智能反爬能力,可高效提取链接元数据并通过 NLP 进行语义分析,最终输出标准化清洗数据。

Url设置为开始节点的input参数

4.代码节点:文章链接url提取

代码节点的主要工作就是从上一个链接节点接受到的文章数组信息进行清洗过滤,提取真正需要的数据,使用规则:title标题长度大于10,并且url链接里包含/p/路径的,保存到输出数组中。

  1. url内容获取批处理节点:

这个节点主要是根据url获取文章的标题和内容

6.文本优化:

文本优化是因为文章比较长,需要用大模型提炼摘要输出。

7.输出节点:

入参是引用前面2个节点的标题、内容。

输出时按照顺序格式简单排列。

格式文本如下:

禾木AI日报
{{title[0].data.title}}
{{content[0].output}}
{{title[1].data.title}}
{{content[1].output}}
{{title[2].data.title}}
{{content[2].output}}
{{title[3].data.title}}
{{content[3].output}}
{{title[4].data.title}}
{{content[4].output}}
{{title[5].data.title}}
{{content[5].output}}
{{title[6].data.title}}
{{content[6].output}}
{{title[7].data.title}}
{{content[7].output}}
{{title[8].data.title}}
{{content[8].output}}
{{title[9].data.title}}
{{content[9].output}}

三. 测试与部署

运行测试,能获取到 AI 资讯就大功告成了。

四. 结论

通过 Coze 工作流,我们实现了 AI 资讯自动化抓取 → 生成日报 的全流程自动化,大大提高了信息获取效率。未来可以进一步优化比如自动推送 。