无需代码的傻瓜式爬虫

RPA是什么?
RPA机器人流程自动化(Robotic process automation):能够代替或者协助人类在计算机、RPA手机等数字化设备中完成重复性工作与任务。
只要预先设计好使用规则,RPA 就可以模拟人工,进行复制、粘贴、点击、输入等操作,协助人类完成大量“规则较为固定、重复性较高、附加值较低”的工作。
RPA技术具有非侵入性和灵活配置两大特点:
企业在进行RPA部署时,不需要改变其现有的信息系统,从而可以避开遗留系统冰山;RPA技术具有非常强的灵活配置性,可以非常贴近企业自己的业务,实现无缝结合。这两个特点可以让RPA技术在企业内部从小到大地实现落地。
RPA的优势:
软件机器人可以帮助企业或者员工完成重复单调的流程性工作,减少人工失误,提高运营效率,降低运营成本。RPA是企业开启数字化转型的钥匙:
- 加快数字化转型:数字驱动高效业务创新,快速实施验证业务流程;敏捷抢占价值空间
- 降本增效:降低运营成本,提升工作效率,基于数据决策
- 智慧流程:洞察企业痛点,快速响应交付,快速联结却不干扰底层
- 员工体验:减少重复劳动,鼓励员工创新,为千禧一代打造极具吸引力的工作体验
机器人流程自动化可以为我们完成哪些工作?
- 通过拖拽丰富的组件(登录程序、打开/抓取浏览器、复制粘贴数据、处理Excel和邮件、填写表单、从文档里提取结构化和半结构化数据等)即可模拟大部分人工操作,实现人工操作的流程自动化,解放人力。
说白了就是把原本重复、枯燥的工作用软件自动完成,而且不需要写代码。
微软RPA(power automate)
官网: https://flow.microsoft.com/zh-cn/

优点
- Win10免费:2021年3月2日,Microsoft终于宣布面向Windows10用户,免费开放PowerAutomate桌面版应用;
- 控件非常丰富,尤其是基于edge浏览器和图像识别的自动化;
- 桌面端安装简单,自带需要的浏览器驱动;
缺点
- 需要微软账号,会自动同步和收集信息;
- 免费版没有技术支持并且强制更新;
- 元素拾取较弱(但是可以通过图像和文字识别解决):不支持C++等软件底层控件;
个人体验
- 像是winform和按键精灵的结合体,只是无需在大量编写代码,但是依旧需要编程的思维
- 相比于10年前的Windows Workflow流程自动化,有了更智能的web组件和机器学习;
- 模拟浏览器+机器学习,更方便地绕过反爬手段;
安装和使用
桌面端下载:https://go.microsoft.com/fwlink/?LinkId=2102613&clcid=0x409
傻瓜式下一步安装,以一个0代码爬虫来看看怎么使用!
傻瓜式爬虫
- 1、打开初始界面,新建一个流

- 2、在web自动化下拖拽一个浏览器控件到中间的画布上

- 3、在自动打开的窗口上输入想要爬取的网址

- 4、拖拽从网页中提取数据

- 5、点击 详细信息,打开网页选取想要提取的数据

- 6、鼠标右键 选中要爬取的内容

- 7、选取列表,网页列表可以自动识别,只要多次选中同类元素,比如 标题、评分:

- 8.修改标题,完成后 可以选择存到excel或变量(处理数据,存入数据库)中

这里选择存入excel

- 9.最后 关闭浏览器

- 10.点击运行,数据就直接存储到excel中了,完美!

总结
一个简单的爬虫只要三步,而且因为模拟浏览器执行,少了很多编程时的反爬措施!
注意
要在浏览器中启用扩展
