中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

利用robots文件做seo優(yōu)化 讓蜘蛛更好的抓取網(wǎng)站

2019-03-26    來源:朱海濤的網(wǎng)站

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

robots文件存在于網(wǎng)站根目錄,是用來告訴百度蜘蛛那些應(yīng)該抓取,那些不應(yīng)該抓取。正確使用robots文件有助于做好seo優(yōu)化,robots文件的核心詞匯就是allow和disallow用法。百度官網(wǎng)是認可這個文件的,在百度站長平臺上也有robots這個欄目,點擊進入,就可以看到你網(wǎng)站robots文件是否編寫正確了。

百度robots文件使用說:

1、robots.txt可以告訴百度您網(wǎng)站的哪些頁面可以被抓取,哪些頁面不可以被抓取。

2、您可以通過Robots工具來創(chuàng)建、校驗、更新您的robots.txt文件,或查看您網(wǎng)站robots.txt文件在百度生效的情況。

3、Robots工具暫不支持https站點。

4、Robots工具目前支持48k的文件內(nèi)容檢測,請保證您的robots.txt文件不要過大,目錄最長不超過250個字符。

上圖我給的一個例子中,disallow語句有問題,原因是把英文的冒號寫成了中文的冒號。

當然直接輸入網(wǎng)站根目錄加上robtots.txt文件也可以

User-agent:*   是用來置頂那些搜索引擎蜘蛛可以抓取的,一般默認設(shè)置

Disallow:/category/*/page/ 分類目錄下面翻頁后的鏈接,比如,進入校賺網(wǎng)分類目錄 "推廣運營經(jīng)驗"目錄后,在翻頁一次,就成了 stcash.com/category/tuiguangyunying/page/2形式了

Disallow:/?s=* Disallow:/*/?s=*  搜索結(jié)果頁面和分類目錄搜索結(jié)果頁面,這里沒必要再次抓取。

Disallow:/wp-admin/ Disallow:/wp-content/ Disallow:/wp-includes/   這三個目錄是系統(tǒng)目錄,一般都是屏蔽蜘蛛抓取

Disallow:/*/trackback  trackback的鏈接

Disallow:/feed Disallow:/*/feed Disallow:/comments/feed  訂閱鏈接

Disallow:/?p=*   文章短鏈接,會自動301跳轉(zhuǎn)到長連接

例如,朱海濤博客之前就被收錄過短連接

Disallow:/*/comment-page-*   Disallow:/*?replytocom*  這兩個我在之前文章有過說明,來自于評論鏈接,很容易造成重復(fù)收錄。

在robots.txt文件的最后還可以制定sitemap文件 Sitemap:http://***.com/sitemap.txt

sitemap地址指令,主流是txt和xml格式。在這里分享一段張戈所寫txt格式的simemap文件。

 

 

 

0) {     foreach($mypages as $page) {     echo get_page_link($page->ID);     echo "\n";     } } ?>

0){ foreach ($terms as $term) {     echo get_term_link($term, $term->slug);     echo "\n";     } } ?>

$tag ) {                $link = get_term_link( intval($tag->term_id), "post_tag" );                if ( is_wp_error( $link ) ) {                   return false;                   $tags[ $key ]->link = $link;                }                   echo $link;                   echo "\n";     } ?>

將上述代碼保存到txt文件,上傳到根目錄,并且在robots.txt文件中指定即可

這里給大家共享下我的robots.txt文件

User-agent: *

Disallow:/wp-admin/

Disallow: /*/comment-page-*

Disallow: /*?replytocom*

Disallow: /wp-content/

Disallow: /wp-includes/

Disallow: /category/*/page/

Disallow: /*/trackback

Disallow: /feed

Disallow: /*/feed

Disallow: /comments/feed

Disallow: /?s=*

Disallow: /*/?s=*\

Disallow: /attachment/

Disallow: /tag/*/page/

Sitemap: http://www.stcash.com/sitemap.xml

來源:校賺網(wǎng)朱海濤 原創(chuàng)文章如轉(zhuǎn)載,請注明本文鏈接: http://www.stcash.com/5564

標簽: robots文件 蜘蛛抓取 網(wǎng)站收錄 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:是誰導(dǎo)致網(wǎng)站排名長期百名外?

下一篇:網(wǎng)站tag對seo影響以及網(wǎng)站優(yōu)化注意事項