审稿状态监控+手机通知实现(Playwright)

目前论文正在审稿,每天必须打开电脑登录网站才能查看审稿状态。年前事闲写了一个审稿状态监控,顺带学习了一下最近火起来的爬虫技术库Playwright。
技术点:Playwright;企业微信通知;
1、Python版本问题
由于版本支持问题Playwright只能在3.7以上的Python版本中安装,
因此在本地安装了Anaconda2018.12,对应Python3.7.1环境。
此时,本地有原本的Anaconda5.2.0环境以及刚刚安装的这两个环境,需要区分并只对3.7版本的环境利用pip进行操作。
我们首先把新安装的环境改一个名字,比如这里将原本的python.exe执行文件改为了python3.7.1

现在我们只要在命令行界面python3.7.1 -m +命令就可以对这个环境进行单独操作了,如
#更新pip命令
python3.7.1 -m pip install --upgrade pip
#安装Playwright
python3.7.1 -m pip install playwright
在安装Playwright成功之后还需要执行:
#安装playwright自带的浏览器和ffmepg,此步骤耗时较长
python3.7.1 -m playwright install
然后就可以进行爬虫设计了,在命令行输入:
python3.7.1 -m playwright codegen
就会自动打开浏览器和录制界面,录制界面会录制你在这个浏览器内的操作并直接生成代码

这里就直接在浏览器访问论文手稿提交页面,可以看到这里就录制生成了访问页面的句子。

进而的填入用户名+密码、点击login都可以生成,不多赘述。
内容提取的实现方式很多,详见【PlayWright教程(三)】基础操作汇总_Code_LT的博客-CSDN博客_playwright获取cookie;这里用一种最简单的方式,其中的内容为XPath:
page.text_content('//*[@id="queue_0"]/td[1]/table/tbody/tr/td[2]/span')
这样就获得了当前的审稿状态。
2、向手机发送通知
这里利用了企业微信进行信息发送,操作比较简便,具体见:
这样在手机的企业微信APP上我们就可以收到当前的审稿状态了。

那么实际上只要写一个判断,当状态Change时才发送通知,这样当审稿进入下一个状态时就可以即时收到通知了。