八爪鱼采集器是一款好用的数据采集软件,其非常好用,能通过确切的数据来指导你的工作内容,而且还可以实现客户实现数据自动化采集,编辑,规范化,摆脱对人工搜索及收集数据的依赖,需要的小伙伴不妨来下载试试吧。
使用方法
步骤一、下载八爪鱼软件并登陆
1、打开/download,即八爪鱼软件官方下载页面,点击图中的下载按钮。
2、软件下载好了之后,双击安装,安装完毕之后打开软件,输入八爪鱼用户名密码,然后点击登陆
步骤二、设置微信文章爬虫规则任务
1、进入登陆界面之后就可以看到主页上的网站简易采集了,选择立即使用即可。
2、进去之后便可以看到目前网页简易模式里面内置的所有主流网站了,需要采集微信公众号内容的,这里选择搜狗即可。
3、搜狗爬虫规则下内置了很多与搜狗搜索相关的采集规则,大家可以根据自己的需求找到搜狗公众号这条爬虫规则,点击即可使用。
4、搜狗公众号简易采集模式任务界面介绍
任务名:自定义任务名,默认为搜狗公众号
任务组:给任务划分一个保存任务的组,如果不设置会有一个默认组
公众号URL列表填写注意事项:提供要采集的网页网址,即搜狗微信中相关公众号的链接。多个公众号输入多个网址即可。
采集数目:输入希望采集的数据条数
示例数据:这个规则采集的所有字段信息。
更新日志
主要体验改进
将正则工具改成在独立的窗口中显示。
Bug修复
解决iframe网页无法识别和采集问题。
解决本地本地采集中不显示二级页面数据的问题。
解决使用日期参数批量生成URL的问题。
解决提取字段XPath只提取第一个匹配的元素问题。
解决导出采集数据到SqlSever界面点击取消和关闭无响应问题。