百度发布通知布告:Baiduspider针对移动抓取user agent(以下简称ua进行了升级,与PC真个抓取ua做到版本统一,均称为Baiduspider/2.0。移动ua和pc ua详情如下:新版移动ua:Mozilla/5.0 (LinuxuAndroid 4.2.2zh-cnAppleWebKit/534.46 (KHTML,like Gecko Version/5.1 Mobile Safari/.6.3(compatible Baiduspider/2.0 + ua:Mozilla/5.0 (compatible Baiduspider/2.0 + ua打开的时候是PC页,移动ua打开的时候是移动页。
通过设置robots的agent封禁达到只让移动Baiduspider抓取的目标,但由于 PC和移动Baiduspider的agent都是Baiduspider,所以这种体例不成取。之前通过“+ 通过关头词“Android”或“Mobile”来进行识别,判断为移动拜候或抓取。2. 通过关头词“Baiduspider/2.0”,判断为百度爬虫。相关阅读:百度官方:spider抓取过程中的策略百度:巧用robots避免蜘蛛黑洞百度:搜索引擎抓取系统概述百度确认:蜘蛛会抓取纯文本链接的URL。
|