站長資訊平臺

隱含語義索引原理及引申的思考

2019-03-08 來源：www.szrtbxg.com

隱含語義索引原理，它是基于一個什么樣的算法呢？它又有什么作用呢？它對關(guān)鍵詞排名的哪個部分起著決定性的作用呢？前面我的一篇文章《從隱含語義索引淺談關(guān)鍵詞布局》提到關(guān)鍵詞相關(guān)的問題，很多朋友想了解更多一點，下面就SEO研究中心的一節(jié)VIP課程和大家分享吧！

1、隱含語義索引原理的作用

隱含語義索引原理主要是解決文章內(nèi)容問題。包括下面幾個方面：

①、內(nèi)容的重復性問題

②、關(guān)鍵詞的相關(guān)性問題

③、關(guān)鍵詞的密度問題

④、關(guān)鍵詞堆砌問題

⑤、文章原創(chuàng)性問題

２、關(guān)鍵詞密度問題

我們學習SEO以后經(jīng)常在思考，搜索引擎是怎么判斷我們的文章是否原創(chuàng)的呢？怎么判斷我們一篇文章是質(zhì)量高還是質(zhì)量低的呢？怎么樣能夠知道我的文章有沒有關(guān)鍵詞堆積？怎么樣能夠知道我的文章中的關(guān)鍵詞密度。

這個隱含語義索引原理就是現(xiàn)在主流搜索引擎用的一個核心的索引原理。它是基于中文分詞原理來的。我們前面的課程中有詳細的講過中文分詞原理。

中文分詞原理就是說，搜索引擎如果要通過上千萬億個網(wǎng)頁去判斷某個關(guān)鍵詞的關(guān)鍵詞排名，并且計算它的排名的話，是非常非常困難的。不可能像現(xiàn)在這樣，在零點零幾秒就能夠計算出一個結(jié)果出來。漢語的詞匯量，一共只有8萬條。通過語義索引，把上千萬億個網(wǎng)頁分割成了8萬條詞條上面，就使得計算變得非常的簡單了。使得計算從一個很復雜的、非常龐大的數(shù)字，變成一個計算機可以人為控制的數(shù)字了，僅僅只有8萬條。

搜索引擎的蜘蛛把一個頁面里的代碼、文字全都下載下來之后，它會進行分析。把這個頁面里面所有的中文字詞整理出來，進行切割。這個切割的過程就是分詞，把頁面內(nèi)容分成若干個不可再分的詞。然后把一些過路詞去掉。什么是過路詞呢？這個、那個、在、的……等等等等，這些關(guān)鍵詞是沒有意義的詞。只留下一些名詞、動詞、形容詞。

把一個頁面分解成這些詞以后，就開始統(tǒng)計每個詞出現(xiàn)的次數(shù)和頻率。這樣搜索引擎就知道了你的關(guān)鍵詞在頁面出現(xiàn)了幾次，也就算出了關(guān)鍵詞密度。

３、關(guān)鍵詞堆砌問題

搜索引擎知道了你的關(guān)鍵詞在頁面出現(xiàn)了幾次，也知道了跟它相關(guān)的詞又在頁面出現(xiàn)了幾次。比如你一個詞出現(xiàn)了100次，它的相關(guān)詞只出現(xiàn)了2次，搜索引擎就知道你肯定是在堆砌關(guān)鍵詞，是在作弊。

所以說，有沒有關(guān)鍵詞堆砌，這是可以算出來的。而且不同的行業(yè)不同的詞，它們的比率是不一樣的。這就解決了關(guān)鍵詞堆砌的問題。

４、相關(guān)性關(guān)鍵詞問題

相關(guān)關(guān)鍵詞它的比率到底是多少呢？比如說SEO培訓，“SEO”出現(xiàn)的次數(shù)，和“SEO培訓”出現(xiàn)的次數(shù)，他們的比率是多少。再比如上海不銹鋼，“上海”出現(xiàn)的次數(shù)，和“上海不銹鋼”出現(xiàn)的次數(shù)，他們的比率又是多少。這個人家是可以算出來的。

你在一篇不相關(guān)的文章插入一個關(guān)鍵詞。比如網(wǎng)站上面根本沒講SEO，你插一個“SEO”在里面。這個時候“SEO”可能就會起反作用。因為它通過隱含索引原理，可以計算出來，你這個關(guān)鍵詞跟你這個頁面不相關(guān)。

５、原創(chuàng)性問題

搜索引擎能不能識別偽原創(chuàng)？它是可以識別的。因為通過相關(guān)語義索引原理，它知道每一個詞的比率。你把位置換一下，難道頻率就不一樣了嗎？頻率還是一樣的，各位！只是說你增加一些詞還有減少一些詞，頻率會有一定量的變化，但是變化不會太大。換近義詞可以，但是近義詞只有一個。而且換近義詞以后關(guān)鍵詞就不是那個詞了。幾篇文章組合也行，但是你這種文章還有可讀性嗎？沒有可讀性了。

有的人可能會問，老師既然如此，為什么我偽原創(chuàng)的文章，還會收錄呢。怎么解釋這個問題。隱含語義索引原理，搜索引擎大體的都是用這個來識別的，但是它不能100%識別。說白了，這是一個程序的計算問題。這個蜘蛛，他就是一個程序。但這是可以實現(xiàn)的技術(shù)問題。你要相信，總有一天，他可以做到接近100%識別的。你明白沒有？所以，你有時候別老想著去做這事。一旦有一天他接近90%了，我可以說，現(xiàn)在互聯(lián)網(wǎng)上大量做垃圾站的那些人，遲早都要完蛋。最后，絕對是用戶體驗最佳的那個網(wǎng)站得勝。認同嗎？搜索引擎的發(fā)展變化太快了，因為搜索引擎有的是錢，有世界上最好的工程師。給用戶帶來最佳體驗的網(wǎng)站以及網(wǎng)站內(nèi)容，絕對會笑到最后，他一定是這樣的。

搜索引擎使用隱含語義索引原理，但是它需要程序去實現(xiàn)，這個過程是多久呢，應該在未來2~3年內(nèi)，就可以接近90%了。90%是一個很猛的數(shù)字了，現(xiàn)在估計只有40%-50%左右。

現(xiàn)在很多站長，已經(jīng)越來越難了，收錄一直在浮動。而為什么很多老站的收錄一直都很穩(wěn)定呢？這到底是什么原因造成的呢？這就是因為隱含語義索引原理的識別度越來越高了。很多長尾關(guān)鍵詞頁面，今天收錄，明天就刪了，是不是這樣子？

６、內(nèi)容重復性問題

隱含語義索引原理，能夠讓大家的網(wǎng)站，重復度高的，收錄越來越少。如果你是采集，以后你的收錄只會越來越少。有兩個解決方案。

第一種，增加你的權(quán)重。

比如有兩個網(wǎng)站，我的權(quán)重比你高。你先發(fā)，我采集你的。因為我的權(quán)重高，蜘蛛先爬到我�；蛘呦扰赖侥悖菦]有馬上收錄，然后爬到我，收錄了。百度會認為誰是原創(chuàng)？告訴大家，如果我的權(quán)重高于你的。百度就會認為我的文章是原創(chuàng)。為什么呢？因為目前為止，百度判斷原創(chuàng)還是主要依靠權(quán)重。除非你比我早發(fā)很多天。否則只要你一發(fā)我就采集你，百度必然會認為我是原創(chuàng)。你肯定干不過我。我一發(fā)就收錄了，而且排名很好。你只能靠慢慢累計權(quán)重提升排名，沒別的辦法。

第二種，我們不去采集，我們做100%原創(chuàng)性的內(nèi)容。

被高權(quán)重的網(wǎng)站采集也沒有關(guān)系。因為不可能永遠那么湊巧，一發(fā)就被采集。而且假設你先把自己內(nèi)容完全做好了的話，如果你是一個新站，請問誰會來采集你？只有你更新很及時而且網(wǎng)站有排名，才會采集你。你認同嗎？如果你一開始把內(nèi)頁全部做好，全部都是原創(chuàng)的。別人是無法采集你的。一開始是不采集，后來是采集也沒用。按照我說的一步一步提升權(quán)重。就像現(xiàn)在的SEOWHY，還有人去采集他嗎？有，但是基本上沒用了。

不建議做任何防采集的設置，會妨礙用戶體驗的。比如說你禁止用戶使用右鍵，或者一些防采集的代碼，都會影響你的收錄以及你的整個網(wǎng)站的優(yōu)化。不能做任何防采集的東西。

７、隱含語義索引原理的引申思考

關(guān)于隱含語義索引原理，我們可以思考兩個問題。

1、保持頁面上關(guān)鍵詞的最新相關(guān)性。

不同的時期內(nèi)，一個關(guān)鍵詞的相關(guān)關(guān)鍵詞是不同的。我們要不斷調(diào)整我們的頁面內(nèi)容，使我們頁面上的關(guān)鍵詞保持最新的相關(guān)性。這樣搜索引擎就會始終認為我們這個網(wǎng)站是有價值的。

2、研究那些外部鏈接比較少，而關(guān)鍵字排名比較靠前的網(wǎng)頁。這些頁面，說明百度對他的內(nèi)容質(zhì)量是打了高分的。

最后總結(jié)一句話：做偽原創(chuàng)、采集是沒有前途的。

作者：青裝SEO研究中心www.moonseo.cn

標簽：關(guān)鍵詞布局隱含語義索引原理內(nèi)容重復性

版權(quán)申明：本站文章部分自網(wǎng)絡，如有侵權(quán)，請聯(lián)系：west999com@outlook.com
特別注意：本站所有轉(zhuǎn)載文章言論不代表本站觀點！
本站所提供的圖片等素材，版權(quán)歸原作者所有，如需使用，請與原作者聯(lián)系。

上一篇:域名被刪除過對網(wǎng)站優(yōu)化所帶來的影響有哪些

下一篇:互惠合作模式下解讀原創(chuàng)內(nèi)容的重要性

相關(guān)文章

最新資訊

熱門推薦

中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

隱含語義索引原理及引申的思考