中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

百度蜘蛛其獨特的爬行研究

2019-03-19    來源:鄭州SEO

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

前段時間seowhy開啟未登陸用戶禁止訪問論壇的權(quán)限,讓我想到的是,如果用戶未登陸不能查看帖子,那百度蜘蛛能否索引到內(nèi)容呢,我簡單的理解為百度蜘蛛的爬行其實就是順著網(wǎng)站中的錨文本鏈接爬行,然后形成一張大網(wǎng),但如果論壇禁止未登陸用戶訪問,那么蜘蛛爬行的鏈接就是死鏈,就抓取不到內(nèi)容,發(fā)帖就沒有效果,其實我的想法是錯誤的,百度蜘蛛其獨特的爬行機制不是我們想象的那么簡單。

前日(10月22日),我修改公司網(wǎng)站的數(shù)據(jù)庫,而后測試發(fā)布了一篇以“啊啊”為標(biāo)題、內(nèi)容的信息,前臺并沒有生成頁面,也就是說這篇文章只有數(shù)據(jù)庫中存在,前臺沒有它的一點信息(因為我有數(shù)據(jù)庫潔癖,為了不讓文章ID錯亂,想著不用刪除,等第二天更新文章修改掉就行,反正也沒生成頁面),第二天(10月23日),我把這條測試文章修改了,又發(fā)不了一篇新的文章,等待收錄查看快照是這樣的。

修改的那篇文章是22日的快照,新發(fā)布的正常,22日時是“啊啊”的內(nèi)容,但點擊百度快照進(jìn)去發(fā)現(xiàn)是新的內(nèi)容,讓我又想到,難道百度收錄文章的快照與文章更新的時間有關(guān)系?于是,今天(10月24日)我又更新了兩篇文章,然后進(jìn)數(shù)據(jù)庫把一片文章的發(fā)布時間改為昨天,等待收錄。

同一時間發(fā)布的兩篇文章變成了上面的收錄展示形式,可見22日發(fā)布的那篇文章其實當(dāng)天就收錄了,只是蜘蛛可能知道內(nèi)容不是用戶要發(fā)布的所以一直沒放出,23日修改內(nèi)容后,前臺更新,蜘蛛順著鏈接爬行到這個網(wǎng)站知道內(nèi)容是真正內(nèi)容了,就替換了22日的收錄并放不來,但快照沒有修改,至于今天發(fā)布的兩偏文章展示不一樣,都只是暫時的,你明天查看,都會變成24日快照,沒有什么不同,只不過今日查看一個顯示詳細(xì)收錄時間,一個顯示當(dāng)天。

從上面的分析可以看出,百度蜘蛛爬行有時是不按我們的常規(guī)思考進(jìn)行的,它會通過各種方法進(jìn)入你的數(shù)據(jù)庫,抓取內(nèi)容,而非與網(wǎng)站前臺的種種限制能阻擋,除非你用robots文件來限制,seowhy雖屏蔽未登陸用戶訪問,但其實百度蜘蛛是可以抓取到內(nèi)容的,因為它與我們用戶的訪問方法不一樣。至于文章的發(fā)布時間,一定程度上會影響文章收錄的快照,但不是絕對。

原文鏈接:鄭州seo http://www.zzzhu.net/news/?p=401

標(biāo)簽: 百度蜘蛛 搜索引擎蜘蛛 錨文本鏈接優(yōu)化 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:百度搜索存在bug 有人利用虛擬外鏈技術(shù)壟斷排名

下一篇:談?wù)劙俣劝倏芐EO的利與弊