无需代码的傻瓜式爬虫

RPA是什么?

RPA机器人流程自动化(Robotic process automation):能够代替或者协助人类在计算机、RPA手机等数字化设备中完成重复性工作与任务。

只要预先设计好使用规则,RPA 就可以模拟人工,进行复制、粘贴、点击、输入等操作,协助人类完成大量“规则较为固定、重复性较高、附加值较低”的工作。

RPA技术具有非侵入性灵活配置两大特点:

企业在进行RPA部署时,不需要改变其现有的信息系统,从而可以避开遗留系统冰山;RPA技术具有非常强的灵活配置性,可以非常贴近企业自己的业务,实现无缝结合。这两个特点可以让RPA技术在企业内部从小到大地实现落地。

RPA的优势:
软件机器人可以帮助企业或者员工完成重复单调的流程性工作,减少人工失误,提高运营效率,降低运营成本。RPA是企业开启数字化转型的钥匙:

  • 加快数字化转型:数字驱动高效业务创新,快速实施验证业务流程;敏捷抢占价值空间
  • 降本增效:降低运营成本,提升工作效率,基于数据决策
  • 智慧流程:洞察企业痛点,快速响应交付,快速联结却不干扰底层
  • 员工体验:减少重复劳动,鼓励员工创新,为千禧一代打造极具吸引力的工作体验

机器人流程自动化可以为我们完成哪些工作?

  • 通过拖拽丰富的组件(登录程序、打开/抓取浏览器、复制粘贴数据、处理Excel和邮件、填写表单、从文档里提取结构化和半结构化数据等)即可模拟大部分人工操作,实现人工操作的流程自动化,解放人力。

说白了就是把原本重复、枯燥的工作用软件自动完成,而且不需要写代码。
微软RPA(power automate)
官网: flow.microsoft.com/zh-c

优点

  • Win10免费:2021年3月2日,Microsoft终于宣布面向Windows10用户,免费开放PowerAutomate桌面版应用;
  • 控件非常丰富,尤其是基于edge浏览器和图像识别的自动化;
  • 桌面端安装简单,自带需要的浏览器驱动;

缺点

  • 需要微软账号,会自动同步和收集信息;
  • 免费版没有技术支持并且强制更新;
  • 元素拾取较弱(但是可以通过图像和文字识别解决):不支持C++等软件底层控件;

个人体验

  • 像是winform和按键精灵的结合体,只是无需在大量编写代码,但是依旧需要编程的思维
  • 相比于10年前的Windows Workflow流程自动化,有了更智能的web组件和机器学习;
  • 模拟浏览器+机器学习,更方便地绕过反爬手段;

安装和使用
桌面端下载:go.microsoft.com/fwlink
傻瓜式下一步安装,以一个0代码爬虫来看看怎么使用!
傻瓜式爬虫

  • 1、打开初始界面,新建一个流
  • 2、在web自动化下拖拽一个浏览器控件到中间的画布上
  • 3、在自动打开的窗口上输入想要爬取的网址
  • 4、拖拽从网页中提取数据

  • 5、点击 详细信息,打开网页选取想要提取的数据

  • 6、鼠标右键 选中要爬取的内容
  • 7、选取列表,网页列表可以自动识别,只要多次选中同类元素,比如 标题、评分:
  • 8.修改标题,完成后 可以选择存到excel或变量(处理数据,存入数据库)中

这里选择存入excel

  • 9.最后 关闭浏览器
  • 10.点击运行,数据就直接存储到excel中了,完美!

总结
一个简单的爬虫只要三步,而且因为模拟浏览器执行,少了很多编程时的反爬措施!

注意
要在浏览器中启用扩展