如何正確識別Baiduspider移動(dòng)ua

關(guān)鍵字:數(shù)據(jù)公司2017-01-09

廈門網(wǎng)站建設(shè):新版移動(dòng)ua:

Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

PC ua:

Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)


之前通過“+http://www.baidu.com/search/spider.html”進(jìn)行識別的網(wǎng)站請注意!您需要修改識別方式,新的正確的識別Baiduspider移動(dòng)ua的方法如下:

  1. 通過關(guān)鍵詞“Android”或者“Mobile”來進(jìn)行識別,判斷為移動(dòng)訪問或者抓取。

  2. 通過關(guān)鍵詞“Baiduspider/2.0”,判斷為百度爬蟲。


另外需要強(qiáng)調(diào)的是,對于robots封禁,如果封禁的agent是Baiduspider,會(huì)對PC和移動(dòng)同時(shí)生效。即,無論是PC還是移動(dòng)Baiduspider,都不會(huì)對封禁對象進(jìn)行抓取。之所以要強(qiáng)調(diào)這一點(diǎn),是發(fā)現(xiàn)有些代碼適配站點(diǎn)(同一個(gè)url,PC ua打開的時(shí)候是PC頁,移動(dòng)ua打開的時(shí)候是移動(dòng)頁),想通過設(shè)置robots的agent封禁達(dá)到只讓移動(dòng)Baiduspider抓取的目的,但由于PC和移動(dòng)Baiduspider的agent都是Baiduspider,這種方法是非常不可取的。(廈門網(wǎng)站建設(shè)文章來自百度新聞)