中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

淺談SEO之原創(chuàng)和偽原創(chuàng)在搜索引擎中的判定

2019-03-08    來源:www.carixy.com

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用

原創(chuàng)和偽原創(chuàng)成為現(xiàn)在互聯(lián)網(wǎng)后時(shí)代一個(gè)重要的話題,即就是如何保“證內(nèi)容為王”的問題,對于門戶型的大互聯(lián)網(wǎng)公司來說,也許他們有專業(yè)的編輯和寫手,但是據(jù)我所了解的,甚然逃不了要去轉(zhuǎn)載別人的文章。如何在原創(chuàng)與非原創(chuàng)之間取得平衡點(diǎn),是做網(wǎng)站運(yùn)營人員和編輯必須進(jìn)行把控的一個(gè)點(diǎn)。

搜索引擎如何辯別原創(chuàng)和偽原創(chuàng)?

以目前的計(jì)算機(jī)來看,是不可能做到真正的人工智能識別內(nèi)容的,也許對英文系還好一些,畢竟英文系的字庫有限,每個(gè)獨(dú)立的英語的意思是獨(dú)立的或者相關(guān)的。并且英文中有默認(rèn)的習(xí)慣用“-”來進(jìn)行區(qū)分。

而中文則就明顯不同。同一個(gè)意思,可以用無數(shù)個(gè)詞來形容,千變?nèi)f化。比如說:“人面桃花”這個(gè)詞的涵義就多了。所以計(jì)算機(jī)是不可能辯識的。那么搜索引擎如何去判定原創(chuàng)和偽原創(chuàng)呢?下面是思路實(shí)現(xiàn)。

首先,搜索引擎把兩篇文章進(jìn)行有機(jī)的篩選,作為比對對象,那如何知道這比對的文章是有關(guān)的呢?當(dāng)然就是關(guān)鍵字,根據(jù)文章的關(guān)鍵字決定的,這也就是為什么文章中要內(nèi)置一定比例的關(guān)鍵字的原因所在,至少如何區(qū)分文章中那一個(gè)是關(guān)鍵字,搜索引擎自有算法解決的,不再多述。

取出兩篇文章以后,計(jì)算機(jī)就進(jìn)行分析:

1、 設(shè)定一個(gè)比例,比如定義為M,標(biāo)注是0.5的系數(shù)。

2、 把A篇文章,根據(jù)字?jǐn)?shù),段落為分三段。B篇文章段落分為三段,然后進(jìn)行算法編譯,也可以理解成為加密之類的,也就是說把文字變成符號。比如說一段話進(jìn)行編譯之后變成了aaacbdfbcdfsdafefasdfasd 這樣的字符串。當(dāng)然不一定是用ABCD這種字符,這樣做的好處是因?yàn)榉奖阌?jì)算機(jī)比對和處理。

3、 然后把A,B兩篇文章經(jīng)過第二步的處理,再通過算法得到,兩篇文章之間的相似度有多少,(估計(jì)這個(gè)對比算法很復(fù)雜,我也只能猜測。)會(huì)得到一個(gè)值,也就是類似上述1中提到的這個(gè)M的系數(shù),根據(jù)標(biāo)準(zhǔn),比如是高于0.5就表示是雷同,低于就表示是不雷同,如果雷同就利用搜索引擎爬行得到的其他的參數(shù)來決定誰是原創(chuàng),或者是非原創(chuàng)。

我們?nèi)绾螒?yīng)對搜索引擎的原創(chuàng)判定呢?

道高一尺,魔高一丈,互聯(lián)網(wǎng)上永遠(yuǎn)沒有絕對的矛與盾,在現(xiàn)在計(jì)算機(jī)還不可能真正實(shí)現(xiàn)人工智能,所以,原創(chuàng)和偽原創(chuàng)是一個(gè)暫且永恒的話題。做最強(qiáng)的偽原創(chuàng)可以如下三步走:

1、標(biāo)題一定要改,并且要改得出神入化。中國的文字很復(fù)雜,同樣的一個(gè)意思可以用很多的方法來體現(xiàn),如果你真的不能改,那么我告訴你一個(gè)方法,就是把標(biāo)題寫長到20-25個(gè)字,你一定很特別的。

2、如果你有不錯(cuò)的文字功功底,你看了人家的文章之后,你就馬上可以在腹稿里形成一定的框架,然后用你的語言進(jìn)行描述,再加上圖片等富文本進(jìn)行修飾,那絕對是一篇難得的偽原創(chuàng)文章。

3、內(nèi)容錯(cuò)亂。網(wǎng)上有很多垃圾站。為什么人家可以得到關(guān)鍵字的排名和流量,原因就是,采集到信息進(jìn)行偽原創(chuàng)之后,就完全可以變得原創(chuàng),這里面最重要的一個(gè)原因就是中國的漢字太復(fù)雜了。程序建立一個(gè)詞庫,通過匹配同義字情況,可以基本上實(shí)現(xiàn)語句的通順,而減少大量的雷同。至于文章的內(nèi)容究竟要表達(dá)作者什么真正的意象,計(jì)算機(jī)根本是讀不懂的。

原創(chuàng)和偽原創(chuàng)是一對天使和魔鬼,你不必憎恨人家把你的文章進(jìn)行偽原創(chuàng),你最多譴責(zé)人家人品不好。所謂文章一大抄。真正的高手當(dāng)然是高端。那就讓偽原創(chuàng)來得更瘋狂吧!

標(biāo)簽: 搜索引擎 網(wǎng)站內(nèi)容 原創(chuàng)文章 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:網(wǎng)站SEO之關(guān)鍵詞的最佳位置

下一篇:谷歌即時(shí)搜索將推出 SEOer將何去何從