中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

隱含語義索引原理及引申的思考

2019-03-08    來源:www.szrtbxg.com

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

隱含語義索引原理,它是基于一個什么樣的算法呢?它又有什么作用呢?它對關(guān)鍵詞排名的哪個部分起著決定性的作用呢?前面我的一篇文章《從隱含語義索引淺談關(guān)鍵詞布局》提到關(guān)鍵詞相關(guān)的問題,很多朋友想了解更多一點,下面就SEO研究中心的一節(jié)VIP課程和大家分享吧!

1、隱含語義索引原理的作用

隱含語義索引原理主要是解決文章內(nèi)容問題。包括下面幾個方面:

①、內(nèi)容的重復(fù)性問題

②、關(guān)鍵詞的相關(guān)性問題

③、關(guān)鍵詞的密度問題

④、關(guān)鍵詞堆砌問題

⑤、文章原創(chuàng)性問題

2、關(guān)鍵詞密度問題

我們學(xué)習(xí)SEO以后經(jīng)常在思考,搜索引擎是怎么判斷我們的文章是否原創(chuàng)的呢?怎么判斷我們一篇文章是質(zhì)量高還是質(zhì)量低的呢?怎么樣能夠知道我的文章有沒有關(guān)鍵詞堆積?怎么樣能夠知道我的文章中的關(guān)鍵詞密度。

這個隱含語義索引原理就是現(xiàn)在主流搜索引擎用的一個核心的索引原理。它是基于中文分詞原理來的。我們前面的課程中有詳細的講過中文分詞原理。

中文分詞原理就是說,搜索引擎如果要通過上千萬億個網(wǎng)頁去判斷某個關(guān)鍵詞的關(guān)鍵詞排名,并且計算它的排名的話,是非常非常困難的。不可能像現(xiàn)在這樣,在零點零幾秒就能夠計算出一個結(jié)果出來。漢語的詞匯量,一共只有8萬條。通過語義索引,把上千萬億個網(wǎng)頁分割成了8萬條詞條上面,就使得計算變得非常的簡單了。使得計算從一個很復(fù)雜的、非常龐大的數(shù)字,變成一個計算機可以人為控制的數(shù)字了,僅僅只有8萬條。

搜索引擎的蜘蛛把一個頁面里的代碼、文字全都下載下來之后,它會進行分析。把這個頁面里面所有的中文字詞整理出來,進行切割。這個切割的過程就是分詞,把頁面內(nèi)容分成若干個不可再分的詞。然后把一些過路詞去掉。什么是過路詞呢?這個、那個、在、的……等等等等,這些關(guān)鍵詞是沒有意義的詞。只留下一些名詞、動詞、形容詞。

把一個頁面分解成這些詞以后,就開始統(tǒng)計每個詞出現(xiàn)的次數(shù)和頻率。這樣搜索引擎就知道了你的關(guān)鍵詞在頁面出現(xiàn)了幾次,也就算出了關(guān)鍵詞密度。

3、關(guān)鍵詞堆砌問題

搜索引擎知道了你的關(guān)鍵詞在頁面出現(xiàn)了幾次,也知道了跟它相關(guān)的詞又在頁面出現(xiàn)了幾次。比如你一個詞出現(xiàn)了100次,它的相關(guān)詞只出現(xiàn)了2次,搜索引擎就知道你肯定是在堆砌關(guān)鍵詞,是在作弊。

所以說,有沒有關(guān)鍵詞堆砌,這是可以算出來的。而且不同的行業(yè)不同的詞,它們的比率是不一樣的。這就解決了關(guān)鍵詞堆砌的問題。

4、相關(guān)性關(guān)鍵詞問題

相關(guān)關(guān)鍵詞它的比率到底是多少呢?比如說SEO培訓(xùn),“SEO”出現(xiàn)的次數(shù),和“SEO培訓(xùn)”出現(xiàn)的次數(shù),他們的比率是多少。再比如上海不銹鋼,“上海”出現(xiàn)的次數(shù),和“上海不銹鋼”出現(xiàn)的次數(shù),他們的比率又是多少。這個人家是可以算出來的。

你在一篇不相關(guān)的文章插入一個關(guān)鍵詞。比如網(wǎng)站上面根本沒講SEO,你插一個“SEO”在里面。這個時候“SEO”可能就會起反作用。因為它通過隱含索引原理,可以計算出來,你這個關(guān)鍵詞跟你這個頁面不相關(guān)。

5、原創(chuàng)性問題

搜索引擎能不能識別偽原創(chuàng)?它是可以識別的。因為通過相關(guān)語義索引原理,它知道每一個詞的比率。你把位置換一下,難道頻率就不一樣了嗎?頻率還是一樣的,各位!只是說你增加一些詞還有減少一些詞,頻率會有一定量的變化,但是變化不會太大。換近義詞可以,但是近義詞只有一個。而且換近義詞以后關(guān)鍵詞就不是那個詞了。幾篇文章組合也行,但是你這種文章還有可讀性嗎?沒有可讀性了。

有的人可能會問,老師既然如此,為什么我偽原創(chuàng)的文章,還會收錄呢。怎么解釋這個問題。隱含語義索引原理,搜索引擎大體的都是用這個來識別的,但是它不能100%識別。說白了,這是一個程序的計算問題。這個蜘蛛,他就是一個程序。但這是可以實現(xiàn)的技術(shù)問題。你要相信,總有一天,他可以做到接近100%識別的。你明白沒有?所以,你有時候別老想著去做這事。一旦有一天他接近90%了,我可以說,現(xiàn)在互聯(lián)網(wǎng)上大量做垃圾站的那些人,遲早都要完蛋。最后,絕對是用戶體驗最佳的那個網(wǎng)站得勝。認同嗎?搜索引擎的發(fā)展變化太快了,因為搜索引擎有的是錢,有世界上最好的工程師。給用戶帶來最佳體驗的網(wǎng)站以及網(wǎng)站內(nèi)容,絕對會笑到最后,他一定是這樣的。

搜索引擎使用隱含語義索引原理,但是它需要程序去實現(xiàn),這個過程是多久呢,應(yīng)該在未來2~3年內(nèi),就可以接近90%了。90%是一個很猛的數(shù)字了,現(xiàn)在估計只有40%-50%左右。

現(xiàn)在很多站長,已經(jīng)越來越難了,收錄一直在浮動。而為什么很多老站的收錄一直都很穩(wěn)定呢?這到底是什么原因造成的呢?這就是因為隱含語義索引原理的識別度越來越高了。很多長尾關(guān)鍵詞頁面,今天收錄,明天就刪了,是不是這樣子?

6、內(nèi)容重復(fù)性問題

隱含語義索引原理,能夠讓大家的網(wǎng)站,重復(fù)度高的,收錄越來越少。如果你是采集,以后你的收錄只會越來越少。有兩個解決方案。

第一種,增加你的權(quán)重。

比如有兩個網(wǎng)站,我的權(quán)重比你高。你先發(fā),我采集你的。因為我的權(quán)重高,蜘蛛先爬到我。或者先爬到你,但是沒有馬上收錄,然后爬到我,收錄了。百度會認為誰是原創(chuàng)?告訴大家,如果我的權(quán)重高于你的。百度就會認為我的文章是原創(chuàng)。為什么呢?因為目前為止,百度判斷原創(chuàng)還是主要依靠權(quán)重。除非你比我早發(fā)很多天。否則只要你一發(fā)我就采集你,百度必然會認為我是原創(chuàng)。你肯定干不過我。我一發(fā)就收錄了,而且排名很好。你只能靠慢慢累計權(quán)重提升排名,沒別的辦法。

第二種,我們不去采集,我們做100%原創(chuàng)性的內(nèi)容。

被高權(quán)重的網(wǎng)站采集也沒有關(guān)系。因為不可能永遠那么湊巧,一發(fā)就被采集。而且假設(shè)你先把自己內(nèi)容完全做好了的話,如果你是一個新站,請問誰會來采集你?只有你更新很及時而且網(wǎng)站有排名,才會采集你。你認同嗎?如果你一開始把內(nèi)頁全部做好,全部都是原創(chuàng)的。別人是無法采集你的。一開始是不采集,后來是采集也沒用。按照我說的一步一步提升權(quán)重。就像現(xiàn)在的SEOWHY,還有人去采集他嗎?有,但是基本上沒用了。

不建議做任何防采集的設(shè)置,會妨礙用戶體驗的。比如說你禁止用戶使用右鍵,或者一些防采集的代碼,都會影響你的收錄以及你的整個網(wǎng)站的優(yōu)化。不能做任何防采集的東西。

7、隱含語義索引原理的引申思考

關(guān)于隱含語義索引原理,我們可以思考兩個問題。

1、保持頁面上關(guān)鍵詞的最新相關(guān)性。

不同的時期內(nèi),一個關(guān)鍵詞的相關(guān)關(guān)鍵詞是不同的。我們要不斷調(diào)整我們的頁面內(nèi)容,使我們頁面上的關(guān)鍵詞保持最新的相關(guān)性。這樣搜索引擎就會始終認為我們這個網(wǎng)站是有價值的。

2、研究那些外部鏈接比較少,而關(guān)鍵字排名比較靠前的網(wǎng)頁。這些頁面,說明百度對他的內(nèi)容質(zhì)量是打了高分的。

最后總結(jié)一句話:做偽原創(chuàng)、采集是沒有前途的。

作者:青裝SEO研究中心www.moonseo.cn

標(biāo)簽: 關(guān)鍵詞布局 隱含語義索引原理 內(nèi)容重復(fù)性 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:域名被刪除過對網(wǎng)站優(yōu)化所帶來的影響有哪些

下一篇:互惠合作模式下解讀原創(chuàng)內(nèi)容的重要性