RPA已死,微软Playwright MCP开启AI自动化革命

前几天发了一个chrome MCP 的视频

群里,有同学发了一个问题:

企业要求看培训视频,每20分钟弹窗检测一次,不点确认就暂停计时。

我花5分钟,让AI Agent帮他自动看完了。

看这个细节

Agent做的脚本,会自动检测继续按钮,发现就立即点击:

这不是简单的自动化脚本,是AI理解了任务后的智能执行。

RPA已死,Agent时代来了

想象这个场景:

你的老板让你每天整理竞品数据。

传统RPA方式: 花3天写脚本 → 调试2天 → 网页改版就崩溃 → 重新写

Agent + Playwright MCP方式: “帮我收集这5个竞品的数据” → AI自动完成

这就是差别:

  • • RPA需要你规划每一步,写死流程
  • • Agent理解你的目标,自己规划执行路径
  • • RPA遇到异常就停止,Agent会自动调整策略

如果一件事值得做,就值得让AI替你做

微软的Playwright MCP:最强 浏览器 MCP

Playwright是微软开发的浏览器自动化框架,现在成了Agent操控网页的最强工具。

上次我推荐了 chrome mcp

但现在,Playwright MCP 更好用

  • • 更强大的数据获取能力:能直接获取小红书等平台的数据
  • • 更快的文本复制速度:处理大量文本时性能更优
  • • 更完整的页面控制:支持复杂的交互操作
  • • 更稳定的执行环境:微软出品,质量保证

说人话:playwright MCP 拥有更高的浏览器权限

15分钟上手:从安装到使用

整个过程只需要15分钟,我把它简化成了3步。

Step 1:安装Playwright MCP(5分钟)

在Claude或其他支持MCP的工具中,添加配置:

{
"mcpServers":{
"playwright":{
"command":"npx",
"args":["@playwright/mcp@latest"]
}
}
}

✅ 安装成功标志:重启后看到playwright相关工具

⚠️ 注意:需要先安装Node.js环境

Step 2:进阶玩法

接下来是几个案例

◆ 案例1:自动看培训视频


什么是Agent?代指 AI Agent,比如 cursor 、trae 、claude code 这类软件。

还记得开头提到的培训视频吗?某企业要求员工看培训视频,每20分钟弹窗检测一次。

让Agent执行这个命令:

写一个脚本,当碰到暂停键,自动点击
用 playwright MCP,打开网址: @网址
把这段代码注入到浏览器console,让它自动运行

他自己就会写一个代码,去操控浏览器了,下面为示例

备注:滑到底入群,获取 批量看视频 的方案

◆ 案例2:小红书数据批量获取

以前需要花几千块买数据服务,现在一句话搞定:

打开我的小红书创作中心,获取所有笔记的数据

Agent会自动:

  • • 逐个点击查看详情
  • • 提取阅读、点赞、评论数据
  • • 生成数据报表

◆ 案例3:突破飞书文档的复制限制

把这个 @飞书文档链接 的内容保存到本地

Agent直接获取页面内容,绕过所有限制。

◆ 案例4:微信文章一键保存

把这篇 @微信文章链接 保存到本地

文字就可以完整保存

未来已来,只是分布不均

固定流程的自动化正在死去,智能编排的时代已经开启。

你不需要学编程,但你需要学会指挥Agent。

“别问AI能为你做什么,问问你想让AI做什么。”

这就是Agent时代的工作方式。

上述教程,均已上线 Agent 叉 MCP:

agentxmcp.com/playwrigh