中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

史上最全面的百度蜘蛛詳解 你不得不看!

2019-03-22    來(lái)源:壓力開(kāi)關(guān)

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

一、什么是Baiduspider?

Baiduspider百度搜索引擎的一個(gè)自動(dòng)程序,它的作用是訪問(wèn)互聯(lián)網(wǎng)上的網(wǎng)頁(yè),建立索引數(shù)據(jù)庫(kù),使用戶能在百度搜索引擎中搜索到您網(wǎng)站上的網(wǎng)頁(yè)。

二、Baiduspider的user-agent是什么?

百度各個(gè)產(chǎn)品使用不同的user-agent:

產(chǎn)品名稱 對(duì)應(yīng)user-agent

無(wú)線搜索 Baiduspider

圖片搜索 Baiduspider-image

視頻搜索 Baiduspider-video

新聞搜索 Baiduspider-news

百度搜藏 Baiduspider-favo

百度聯(lián)盟 Baiduspider-cpro

商務(wù)搜索 Baiduspider-ads

網(wǎng)頁(yè)以及其他搜索 Baiduspider

三、Baiduspider對(duì)一個(gè)網(wǎng)站服務(wù)器造成的訪問(wèn)壓力如何?

為了達(dá)到對(duì)目標(biāo)資源較好的檢索效果,Baiduspider需要對(duì)您的網(wǎng)站保持一定量的抓取。我們盡量不給網(wǎng)站帶來(lái)不合理的負(fù)擔(dān),并會(huì)根據(jù)服務(wù)器承受能力,網(wǎng)站質(zhì)量,網(wǎng)站更新等綜合因素來(lái)進(jìn)行調(diào)整。如果您覺(jué)得baiduspider的訪問(wèn)行為有任何不合理的情況,您可以反饋至百度投訴平臺(tái)。

四、為什么Baiduspider不停的抓取我的網(wǎng)站?

對(duì)于您網(wǎng)站上新產(chǎn)生的或者持續(xù)更新的頁(yè)面,Baiduspider會(huì)持續(xù)抓取。此外,您也可以檢查網(wǎng)站訪問(wèn)日志中Baiduspider的訪問(wèn)是否正常,以防止有人惡意冒充Baiduspider來(lái)頻繁抓取您的網(wǎng)站。 如果您發(fā)現(xiàn)Baiduspider非正常抓取您的網(wǎng)站,請(qǐng)通過(guò)投訴平臺(tái)反饋給我們,并請(qǐng)盡量給出Baiduspider對(duì)貴站的訪問(wèn)日志,以便于我們跟蹤處理。

五、如何判斷是否冒充Baiduspider的抓取?

建議您使用DNS反查方式來(lái)確定抓取來(lái)源的ip是否屬于百度,根據(jù)平臺(tái)不同驗(yàn)證方法不同,如linux/windows/os三種平臺(tái)下的驗(yàn)證方法分別如下:

1,在linux平臺(tái)下,您可以使用host ip命令反解ip來(lái)判斷是否來(lái)自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即為冒充。

$ host 123.125.66.120

120.66.125.123.in-addr.arpa domain name pointer

baiduspider-123-125-66-120.crawl.baidu.com.

host 119.63.195.254

254.195.63.119.in-addr.arpa domain name pointer

BaiduMobaider-119-63-195-254.crawl.baidu.jp.

2,在windows平臺(tái)或者IBM OS/2平臺(tái)下,您可以使用nslookup ip命令反解ip來(lái) 判斷是否來(lái)自Baiduspider的抓取。打開(kāi)命令處理器 輸入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 來(lái)判斷是否來(lái)自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即為冒充。

3,在mac os平臺(tái)下,您可以使用dig 命令反解ip來(lái) 判斷是否來(lái)自Baiduspider的抓取。打開(kāi)命令處理器 輸入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip,來(lái)判斷是否來(lái)自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即為冒充。

六、我不想我的網(wǎng)站被Baiduspider訪問(wèn),我該怎么做?

Baiduspider遵守互聯(lián)網(wǎng)robots協(xié)議。您可以利用robots.txt文件完全禁止Baiduspider訪問(wèn)您的網(wǎng)站,或者禁止Baiduspider訪問(wèn)您網(wǎng)站上的部分文件。 注意:禁止Baiduspider訪問(wèn)您的網(wǎng)站,將使您的網(wǎng)站上的網(wǎng)頁(yè),在百度搜索引擎以及所有百度提供搜索引擎服務(wù)的搜索引擎中無(wú)法被搜索到。關(guān)于robots.txt的寫作方法,請(qǐng)參看我們的介紹:robots.txt寫作方法

您可以根據(jù)各產(chǎn)品不同的user-agent設(shè)置不同的抓取規(guī)則,如果您想完全禁止百度所有的產(chǎn)品收錄,可以直接對(duì)Baiduspider設(shè)置禁止抓取。

以下robots實(shí)現(xiàn)禁止所有來(lái)自百度的抓取:

User-agent: Baiduspider

Disallow: /

以下robots實(shí)現(xiàn)禁止所有來(lái)自百度的抓取但允許圖片搜索抓取/image/目錄:

User-agent: Baiduspider

Disallow: /

User-agent: Baiduspider-image

Allow: /image/

請(qǐng)注意:Baiduspider-cpro抓取的網(wǎng)頁(yè)并不會(huì)建入索引,只是執(zhí)行與客戶約定的操作,所以不遵守robots協(xié)議,如果Baiduspider-cpro給您造成了困擾,請(qǐng)聯(lián)系union1@baidu.com。

Baiduspider-ads抓取的網(wǎng)頁(yè)并不會(huì)建入索引,只是執(zhí)行與客戶約定的操作,所以不遵守robots協(xié)議,如果Baiduspider-ads給您造成了困擾,請(qǐng)聯(lián)系您的客戶服務(wù)專員。

七、為什么我的網(wǎng)站已經(jīng)加了robots.txt,還能在百度搜索出來(lái)?

因?yàn)樗阉饕嫠饕龜?shù)據(jù)庫(kù)的更新需要時(shí)間。雖然Baiduspider已經(jīng)停止訪問(wèn)您網(wǎng)站上的網(wǎng)頁(yè),但百度搜索引擎數(shù)據(jù)庫(kù)中已經(jīng)建立的網(wǎng)頁(yè)索引信息,可能需要數(shù)月時(shí)間才會(huì)清除。另外也請(qǐng)檢查您的robots配置是否正確。

如果您的拒絕被收錄需求非常急迫,也可以通過(guò)投訴平臺(tái)反饋請(qǐng)求處理。

八、我希望我的網(wǎng)站內(nèi)容被百度索引但不被保存快照,我該怎么做?

Baiduspider遵守互聯(lián)網(wǎng)meta robots協(xié)議。您可以利用網(wǎng)頁(yè)meta的設(shè)置,使百度顯示只對(duì)該網(wǎng)頁(yè)建索引,但并不在搜索結(jié)果中顯示該網(wǎng)頁(yè)的快照。

和robots的更新一樣,因?yàn)樗阉饕嫠饕龜?shù)據(jù)庫(kù)的更新需要時(shí)間,所以雖然您已經(jīng)在網(wǎng)頁(yè)中通過(guò)meta禁止了百度在搜索結(jié)果中顯示該網(wǎng)頁(yè)的快照,但百度搜索引擎數(shù)據(jù)庫(kù)中如果已經(jīng)建立了網(wǎng)頁(yè)索引信息,可能需要二至四周才會(huì)在線上生效。

九、Baiduspider抓取造成的帶寬堵塞?

Baiduspider的正常抓取并不會(huì)造成您網(wǎng)站的帶寬堵塞,造成此現(xiàn)象可能是由于有人冒充Baiduspider惡意抓取。如果您發(fā)現(xiàn)有名為Baiduspider的agent抓取并且造成帶寬堵塞,請(qǐng)盡快和我們聯(lián)系。您可以將信息反饋至投訴平臺(tái),如果能夠提供您網(wǎng)站該時(shí)段的訪問(wèn)日志將更加有利于我們的分析。

本文由壓力開(kāi)關(guān)(http://www.shmind.com)網(wǎng)編整理發(fā)表,轉(zhuǎn)載請(qǐng)保留!

標(biāo)簽: 百度蜘蛛 搜索引擎 網(wǎng)站服務(wù)器 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:UTO優(yōu)化是用戶互動(dòng)生成內(nèi)容的優(yōu)化方式

下一篇:SEO干貨分享:由實(shí)例談title標(biāo)簽該如何設(shè)置?