中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

SEO原創(chuàng)識(shí)別具體應(yīng)用與站內(nèi)權(quán)重繼承算法補(bǔ)充

2019-03-22    來源:cmshtml.com

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用

之前看到搜索引擎原創(chuàng)識(shí)別與站內(nèi)權(quán)重繼承算法解析這篇文章,寫的很好,但對(duì)于普通水平的同學(xué)來說很難理解,同時(shí)也有一部分算法未提及。

對(duì)于原創(chuàng)的識(shí)別上,原文提到的提取關(guān)鍵詞,然后運(yùn)用md5或者頻率對(duì)比的方式是可以的,但實(shí)際運(yùn)用起來可能效果不是很好。在搜索引擎對(duì)原創(chuàng)內(nèi)容識(shí)別上,按照關(guān)鍵詞詞頻(TF)的比較閑的有些低級(jí),應(yīng)為內(nèi)容太多,很容易出現(xiàn)誤判的情況。所以,還需要另一個(gè)指標(biāo)來判斷。這種方法就是切片比較,按照固定步長對(duì)內(nèi)容進(jìn)行切片,比較其相似度,會(huì)更接近于真實(shí)結(jié)果。切片比較可以很好的識(shí)別段落打亂的偽原創(chuàng)手法。

頁面降噪技術(shù)搜索引擎使用的很廣泛,對(duì)于大部分標(biāo)題+正文的內(nèi)容,都可以用降噪技術(shù)來獲得接近于真實(shí)內(nèi)容的內(nèi)容。那么,我們在SEO中就需要在正文中間加入干擾因素來打斷搜索引擎的提詞、切片。加入的內(nèi)容可以使錨文本鏈接、也可以使相關(guān)的一段話。同時(shí),這種手法同樣可以打亂搜索引擎的向量化處理。

原文中還提高了站內(nèi)權(quán)重繼承問題。站內(nèi)的頁面權(quán)重繼承并非像原文作者說的那樣簡單,權(quán)重分配也并非簡單的平均分配。同時(shí),為了防止一個(gè)網(wǎng)站通過短時(shí)間內(nèi)大量制造內(nèi)鏈來提高自身權(quán)重的問題,在站內(nèi)權(quán)重傳遞過程中還會(huì)加入一個(gè)阻尼基數(shù),這個(gè)阻尼基數(shù)一般為0.15。也就是說,如果一個(gè)頁面有一百個(gè)導(dǎo)出鏈接,會(huì)有其中的15個(gè)鏈接不會(huì)參與到權(quán)重的傳遞。按照鏈接出現(xiàn)的位置,各個(gè)位置的鏈接所獲得的權(quán)重繼承也不一樣;按照鏈接使用的標(biāo)簽不同,各個(gè)鏈接所獲得的權(quán)重繼承也不一樣;按照不同的相關(guān)度,各個(gè)鏈接所獲得的權(quán)重繼承也不一樣。這里補(bǔ)充一點(diǎn),對(duì)于某些位置的鏈接,可能會(huì)由于去噪或者阻尼基數(shù)優(yōu)先剔除。

權(quán)重繼承算法是一個(gè)很復(fù)雜的公式,類似google pr計(jì)算公式。原文還提到了一個(gè)對(duì)于中文語法的應(yīng)用。其實(shí)搜索引擎不會(huì)太多的關(guān)注中文語法,只需要找出停止詞就可以了,這里的停止詞,可以是任何詞性,也可以是任何語法單元。搜索引擎對(duì)于提取的詞都是作為名詞看待,而在詞義上偏褒義詞。因?yàn)橛脩舻乃阉鲃?dòng)作是中性的,并不會(huì)對(duì)搜索關(guān)鍵詞賦予感情色彩;蛟S未來會(huì)出現(xiàn)感情色彩搜索引擎,讓你選擇搜索時(shí)的情感狀態(tài),在返回不同的結(jié)果,不過現(xiàn)在看來,似乎有些理想化了。

雖然搜索引擎不會(huì)區(qū)分詞性,但會(huì)區(qū)分語氣。因?yàn)檎Z氣可以判斷用戶需求。當(dāng)你搜索糖果時(shí),搜索引擎無法判斷你是想找好吃的糖果,還是一個(gè)品牌,還是糖果的作用等等。但當(dāng)你搜索什么糖果時(shí),搜索引擎就可以判斷你的需求很強(qiáng)烈,也許你在找最好吃的糖果,也許是找最貴的糖果、也有可能是最難看的等等。

這里就比較難以理解,因?yàn)閷?duì)“最好吃的糖果”這個(gè)詞來說,里面含有形容詞“好吃”,但前面我說了,搜索引擎不會(huì)區(qū)分詞性,只會(huì)區(qū)分語氣。這里的“最”也就代表了語氣,而“好吃”只是作為名詞來看待。大家可以百度“好糖果”和“好 糖果”,看看百度的結(jié)果,就可以發(fā)現(xiàn)這個(gè)問題了。排名靠前的,往往是帶有疑問語氣或者加重語氣的標(biāo)題。

這次就寫到這吧,寫的有些亂,下次整理一下。同樣,也要申明一下,以上內(nèi)容小部分為個(gè)人理解,大部分為別人分享的內(nèi)容。有這方面興趣的朋友可以到微博找我:http://www.weibo.com/se6en

標(biāo)簽: 搜索引擎 搜索引擎優(yōu)化 百度算法 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:一位網(wǎng)站被百度K站150天站長的心路歷程

下一篇:搜索引擎營銷之搜索引擎發(fā)展的四個(gè)階段