首先说下图文无关,最近很喜欢《请回答1988》所以这个题图,哈哈哈哈~

今天介绍一个超级简单好用的数据爬虫工具,可以从网页上面把你想要的数据轻松拿下来。它就是谷歌插件Instant Data Scraper

什么是 Instant Data Scraper?

此插件使用 AI (人工智能)技术,可以判断页面中最相关的内容进行抓取,各种网站都支持。

插件使用起来非常非常非常简单,以采集亚马逊评论 为例:

Instant Data Scraper

1. 打开产品 评论 页的第一页,网址格式如:amazon.com/product-revi产品的ASIN

2. 点击 浏览器右上角Instant Data Scraper 插件图标,打开「精灵球」

3. 「精灵球」会自动判断可抓取的页面区域,如果区域不对,点击 「Try another table」 按钮可以切换区域

4. 点击「Locate “Next” button」 按钮来定位页面中的「Next」按钮或链接

5. 点击「Start crawling」按钮开始爬取页面,插件会实时显示爬取到数据,请耐心等待,切勿打开其他页面,不然爬取会中断出错

6. 等数据都爬取完了就可以点击绿色按钮进行下载,可选 CSV 或 Excel 文件

7. 打开下载好的 CSV 或 Excel 文件,删掉你不需要的数据列即可~~

对于需要数据采集却无法下载的同学来说很好用!!!