中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

如何制作符合搜索引擎要求的XML地圖

2019-03-05    來源:Chinaz用戶投稿

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

正如我們所知道的那樣,網(wǎng)站地圖總共有兩種格式,一為HTML網(wǎng)站地圖(就是我們在很多網(wǎng)站中常見的底部文件中的站點地圖),主要是方便用戶快速了解網(wǎng)站框架服務并快速定位到其所想訪問的內(nèi)容,同時有助于搜索引擎有組織、有條理的訪問網(wǎng)站;另一種是XML網(wǎng)站地圖,這種站點地圖主要是為包括GOOGLE、YAHOO等在內(nèi)的大型搜索引擎服務的,BAIDU目前雖還未明確表態(tài)支持這種網(wǎng)站地圖,但隨著目前各大搜索引擎紛紛支持的趨勢發(fā)展下去,BAIDU恐也很難免俗。

我們今天要探討的是XML格式的網(wǎng)站地圖制作及提交流程,至于HTML的站點地圖,留著以后再開篇文章專門討論。

在探討XML戰(zhàn)地地圖如何制作之前,我們要先知道:什么是XML網(wǎng)站地圖?為什么要做XML的網(wǎng)站地圖?

先來解決第一個問題:什么是XML格式的網(wǎng)站地圖?

根據(jù)GOOGLE網(wǎng)站管理員工具中關于Sitemap.xml的定義:XML Sitemap - 通常稱為 Sitemap(使用大寫 S),是您向 Google 提供有關您網(wǎng)站信息的一種方法。 Sitemap 就是您網(wǎng)站上網(wǎng)頁的列表。 創(chuàng)建并提交 Sitemap 有助于確保 Google 知道您網(wǎng)站上的所有網(wǎng)頁,包括 Google 的正常抓取過程可能無法找到的網(wǎng)址。

是不是覺得GOOGLE官方的解釋晦澀難懂呢,像我們這種非專業(yè)人士其實完全可以簡單通俗易懂的理解一下,就是:Sitemap.xml是google搞出來的鬼,也就是網(wǎng)站地圖,不過這個網(wǎng)站地圖是用xml寫的,而且要按google的標準來寫,并且要將寫出來的這個文件sitemap.xml上傳到自己的服務器空間中去。至于什么是XML文件,怎么編寫XML文件,也不在今天探討的范圍之內(nèi),建議有興趣的可以自行GOOGLE學習一下。

好了,第一個問題解決了,緊接下來是第二個問題:為什么要制作sitemap.xml??

我們還是先看一下GOOGLE對于制作sitemap.xml的目的官方說明,然后再給個比較通俗點的理解(今天很多概念、說法等都需要引用GOOGLE的官方說法,同時再給個通俗一點的解釋,倒不是為了反襯GOOGLE的說明有多難懂,而是站在我們草根一族角度來說:寫不了高深的武林秘籍,題個讀后感之類的露個臉也可以)。

GOOGLE對于為啥要做sitemaps.xml的官方解釋:

如果網(wǎng)站屬于下列情況,那么 Sitemap 會特別實用:

網(wǎng)站含動態(tài)內(nèi)容。

網(wǎng)站有不容易被 Googlebot 在抓取過程中發(fā)現(xiàn)的頁面,如有大量富 AJAX 或 Flash 內(nèi)容的頁面。

網(wǎng)站為新網(wǎng)站且指向網(wǎng)站的鏈接不多。 (Googlebot 會跟隨鏈接從一個網(wǎng)頁到另一個網(wǎng)頁抓取網(wǎng)絡,因此,如果您的網(wǎng)站沒有很好地鏈接,我們可能很難發(fā)現(xiàn)它。)

網(wǎng)站有大量內(nèi)容頁存檔,這些內(nèi)容頁相互沒有很好地鏈接,或根本就沒有鏈接。

草根一點的理解就是:提交sitemap一是有利于搜索抓取一些正常抓取過程中無法抓取的網(wǎng)址,比如動態(tài)網(wǎng)頁,包含大量AJAX的網(wǎng)頁或者flash的頁面。二是為搜索蜘蛛指明“工作方向”。Sitemap就是你網(wǎng)站上頁面的列表,googlebot就按照這個去一個個的抓取收錄頁面,顯然比它自己去找會效率高,而且要全。

好了,回答完以上兩個問題后,馬上就切入正題了:如何制作符合搜索引擎要求的XML SITEMAP。

GOOGLE在其幫助指南中提供了多種創(chuàng)作sitemap.xml的方法,如基于GOOGLE協(xié)作平臺創(chuàng)建并驗證的網(wǎng)站可直接提交、使用RSS或ATOM供稿作為SITEMAP、根據(jù)SITEMAP協(xié)議創(chuàng)作的sitemap.xml與其他方式等。

這么多方法中,目前符合國內(nèi)使用習慣或多數(shù)人采用的,是根據(jù)sitemap協(xié)議自行創(chuàng)作sitemap.xml,這也是我們今天要討論的。如果網(wǎng)站采用ASP編程,可在網(wǎng)上搜索添加一段開源代碼使其在后臺中按照想要的格式生成相應的sitemap.xml文件;如果使用的是基于wordpress的開源系統(tǒng),可使用WP自行攜帶的功能生成文件;如果你感覺自己的技術很牛又不喜歡用這些功能的話,可自行手動編寫符合 sitemap協(xié)議0.9(GOOGLE支持的)標準的站點地圖……………如果,再如果,你的網(wǎng)站不是以上情況中的任何一種,同時技術跟我一樣很菜的情況下,那么,只能借助于目前一些免費的軟件來制作我們所想要的地圖了。

一直在苦苦搜尋一款比較好用的Sitemap制作工具,可惜找了許久都無功而返,不是搜索鏈接不全,就是速度過慢,前段遇到一個稍微好用點的,可是有數(shù)量限制,生成1000個之后就自動退出(目前網(wǎng)上這種軟件魚目混珠,一搜一大把,但基本是限制在1000個鏈接內(nèi)的)。直到這幾天,我找到了它——老虎牌sitemap生成器,以前的郁悶一掃而空,同時不斷的帶來驚喜,不但沒有1000個鏈接的限制,而且操作使用極其方便,在此感謝不認識的老虎兄弟的辛苦工作,才讓我們菜鳥們有這么一塊好用的利器。

這個是老虎SITEMAP生成器的操作頁面,功能不復雜,操作極其簡單。

在制作SITEMAP之前,可先做一些設置。點擊“工具”,選擇“選項”,在彈出框中選定“默認值”一欄,里面有關于SITEMAP中的一些設置,包括更新頻次(changefreq)與優(yōu)先級(priority)兩項,這是sitemap.xml中要體現(xiàn)的,關于這兩個參數(shù)的含義下面將具體描述。

因軟件功能限制,可以在操作之前將這兩個參數(shù)設置一下,也可以留空后面再根據(jù)需要補充,我用的時候就是留空,等結束了再手動設定借個頁面的更新頻次與優(yōu)先級,影響不大。

輸入要做地圖的網(wǎng)站網(wǎng)址,同時選擇保存路徑,要注意的一點是,默認的文件格式是xml,不要修改。點擊“開始”即可,記得在生成過程中定時保存。

在這個頁面中,注意到右側的“上次更改時間”、“更新頻率”、“優(yōu)先級”都為空,在整個站點地圖生成完畢后,統(tǒng)一修改。目前網(wǎng)上的SITEMAP生成軟件(包括老虎在內(nèi)),都沒有提供一個比較智能的頁面更新頻次與優(yōu)先級設定功能,因此這邊采用最傳統(tǒng)的方式,也偷懶一點,先是所有的鏈接更新頻次設定為“daily“,優(yōu)先級設置為”0.6“,然后挑出幾個重要頁面與特殊頁面,手動修改其更新頻次與優(yōu)先級,如首頁www.kinig.com的更新頻次為daily,優(yōu)先級為1.0,而about us或contact us的更新頻次可能就是yearly,優(yōu)先級為0.4了,幾個認為比較重要的頁面修改一下,如果偷懶全置空或者所有的更新頻次與優(yōu)先級全設置為相同,那么在上傳并提交給GOOGLE后會出現(xiàn)錯誤的提示。

操作方法是隨便選擇一條鏈接,雙擊之后會彈跳出一個頁面,頁面中“更新頻次”選擇daily,“優(yōu)先級”選擇0.6,點擊右側“應用到所有鏈接”后確定即可,然后手動挑選出重要頁面,按照上述方法進行修改,唯一的區(qū)別就是不選擇“應用到所有鏈接”。

sitemap完全生成并修改后,保存,然后點擊上面的第四個按鈕”sitemap“,查看sitemap.xml文件。

xml文件的創(chuàng)建在google官方中詳細描述,這里只簡單介紹一下部分代碼語句:

<?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" >

      <url>

             <loc>http://www.kinig.com</loc>

             <lastmod>2008-12-29</lastmod>

             <changefreq>daily</changefreq>

             <priority>1.0</priority>

      </url>

      <url>

             <loc>http://www.kinig.com/contact.htm</loc>

             <lastmod>2008-12-19</lastmod>

             <changefreq>yearly</changefreq>

             <priority>0.4</priority>

      </url>

      …

      …

</urlset>

代碼解釋: 

<?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" >

        這兩行就相當于網(wǎng)頁文件中的<html>標簽一樣的作用。不必管這兩行什么意思,照抄即可。

        切記:一個字符也不能錯,即使多一個空格,google網(wǎng)站采集時也會報錯。另外,千萬別忘了在文件的末尾加上</urlset>標簽。

<loc>http://www.kinig.com/contact.htm</loc>

        這里是頁面鏈接地址,也就是你希望蜘蛛訪問的地址。

lastmod:頁面最后修改時間

        這個很重要。Google的機器人會在索引此鏈接前先和上次索引記錄的最后更新時間進行比較,如果時間一樣就會跳過不再索引。所以如果你的鏈接內(nèi)容基于上次Google索引時的內(nèi)容有所改變,應該更新該時間,讓Google下次索引時會重新 對該鏈接內(nèi)容進行分析和提取關鍵字。這里必須用ISO 8601中指定的時間格式進行描述,格式化的時間格式如下:

年:YYYY(2008)

年和月:YYYY-MM(2008-12)

年月日:YYYY-MM-DD(2008-12-29)

年月日小時分鐘:YYYY-MM-DDThh:mmTZD(2008-12-29T10:37+08:00)

年月日小時分鐘秒:YYYY-MM-DDThh:mmTZD(2008-12-29T10:37:30+08:00)

這里需注意的是TZD,TZD指定就是本地時間區(qū)域標記,像中國就是+08:00了

切記:其他格式可能引起出錯,比如將2008-08-08 寫成2008-8-8就會出問題。


changefreq:頁面內(nèi)容更新頻率。

        這里可以用來描述的單詞共這幾個:"always", "hourly", "daily", "weekly", "monthly", "yearly",具體含義我就不用解釋了吧,光看單詞的意思就明白了。如果要了解詳細的意思,可以查看google對于更新頻次的定義

priority:相對于其他頁面的優(yōu)先權

定于0.1 - 1.0之間 。

切記:建議將各類網(wǎng)頁根據(jù)重要性給出不同的數(shù)值,以方便蜘蛛的采集,不要耍小聰明全部寫1.0,google管理工具會報錯的。

   sitemap.xml制作好后,上傳到網(wǎng)站根目錄下,如http://www.kinig.com/sitemap.xml,同時登陸GOOGLE管理員工具,按照其提示與要求進行提交。Google提交網(wǎng)址:

http://www.google.com/webmasters/sitemaps/?hl=zh-CN

        提交后,在幾個小時內(nèi),系統(tǒng)就會開始下載處理了。

        提交后,還有一項工作需要做:SITEMAP的驗證。

        驗證網(wǎng)站地圖是否符合標準,最方便的手段就是使用google的管理員工具了。

        在他下載sitemap.xml后幾天內(nèi),這個工具就會將詳細的分析結果反饋回來,包括:sitemap.xml中包含了多少地址,google已將多少地址加入索引,sitemap.xml中出現(xiàn)了哪些錯誤,甚至蜘蛛采集過程中遇到的各種問題,比如哪些網(wǎng)頁有404,500錯誤都會詳細的羅列出來,非常方便。

        如果你提交的xml文件一切無誤,那么接下來,你就是等著讓它的搜索蜘蛛來爬了,sitemap的文件告知了文件更新的頻率,這樣搜索蜘蛛來得更勤快,頁面被收錄當然也就更快。

標簽: Baidu chinaz flash Google html PR site sitemap Sitemaps Sitemap制作 URL WordPress 

版權申明:本站文章部分自網(wǎng)絡,如有侵權,請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:四個也許網(wǎng)上從來沒有人提到過的SEO問題

下一篇:2008年SEO發(fā)展總結:SEO獲得Google認可