中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

搜索引擎是如何確定你的內(nèi)容就是原創(chuàng)內(nèi)容

2019-03-05    來源:新浪

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

很多人在群里聊到一些事情,比如原創(chuàng)是如何被搜索引擎確定的?核桃今天分享一下自己對搜索引擎確定原創(chuàng)內(nèi)容的看法。

首先我們明確兩個概念:原創(chuàng)與偽原創(chuàng)

原創(chuàng):簡單地理解就是第一次在網(wǎng)絡(luò)上發(fā)表的內(nèi)容。

偽原創(chuàng):就是對原創(chuàng)進行的第二次或者第N次經(jīng)過修改的轉(zhuǎn)載發(fā)表。比如修改標題,增加摘要,轉(zhuǎn)載不完整內(nèi)容等等。

搜索引擎對于原創(chuàng)的判斷是如何進行的呢?

一般來講有以下幾個方面的因素決定:

1、快照日期。

2、蜘蛛抓取日期。

3、頁面外鏈的多少。

4、文章修改的程度。

舉例:如果一篇標題為《搜索引擎如何確定你的就是原創(chuàng)內(nèi)容》的文章在今天10點第一次發(fā)表在一個博客或者網(wǎng)站上。會有什么結(jié)果呢?

搜索引擎蜘蛛來到這個博客或者網(wǎng)站,發(fā)現(xiàn)這個頁面,分析內(nèi)容,放入數(shù)據(jù)庫,并且被確定為首次發(fā)現(xiàn),這肯定就是原創(chuàng)了!

那么這個收錄與判斷的過程中間有幾個細節(jié)方面問題:

1、必要條件

——假如這個網(wǎng)站沒有被收錄,這篇文章會認為是原創(chuàng)嗎?

——當然不是!因為它根本不可能出現(xiàn)在搜索數(shù)據(jù)庫里!

——如何讓它成為原創(chuàng)內(nèi)容?

——第一個條件,網(wǎng)站必須有被搜索引擎收錄。

——假如這個網(wǎng)站收錄了,但是不經(jīng)常更新呢?

——很簡單,如果不經(jīng)常更新,發(fā)表的文章到收錄的時候也會認為是原創(chuàng)的。

3、轉(zhuǎn)載與采集

——如果文章被轉(zhuǎn)載了呢?

——如果文章被轉(zhuǎn)載,那么看轉(zhuǎn)載這篇文章的站更新周期與首次發(fā)表站的更新周期哪個更快。

——不太明白更新周期。

——比如在A站發(fā)表,B站轉(zhuǎn)載,如果蜘蛛先訪問了A站,發(fā)現(xiàn)了文章,再來到B站發(fā)現(xiàn)了文章,很明顯的,原創(chuàng)權(quán)重歸A站。

——采集的情況是否符合這種情況?

——是的,采集的情況一樣。如果B采集A,但B收錄比A早,B就可能變成原創(chuàng)嘍!

4、訪問時間

——如果蜘蛛先訪問了B站呢?

——當然權(quán)重給B站,一般的情況下都會這樣!

——如果B站轉(zhuǎn)載的文章帶了A站的原文章頁面鏈接呢?

——這就很明白了,剛收錄的時候,如果排名,兩條結(jié)果一起出現(xiàn),有可能還是B站的排名好一點。

當然,文章轉(zhuǎn)載次數(shù)多了以后,A站的鏈接越多,對A站的文章越有好處,排名會慢慢變成A站在前面。

——如果另外轉(zhuǎn)載的文章帶的是B站頁面的鏈接呢?

——這種情況就搞笑了,給搜索引擎開了個玩笑,但它們?nèi)绻袛嗖缓,就變成了一個鏈接流行度的比賽了。

不過,如果都有很多外部鏈接,并且相差不大,那么判斷的規(guī)則應(yīng)該回到原點,誰先被收錄誰就是原創(chuàng)。

5、快照日期

——快照日期顯示時間最早的,一般就是原創(chuàng)了吧!

——不一定,這個說法要在一個更新周期之內(nèi),比如說文章發(fā)表后一周內(nèi),快照時間越早的地址將越有被認可為原創(chuàng)的可能。

但如果文章都發(fā)表了幾個月了,說不定搜索引擎已經(jīng)重新獲取過快照了,快照的日期就變了!

——還有其它的可能嗎?

——有,一般比如百度收錄,他可能會有一個收錄的數(shù)據(jù)庫,經(jīng)過過濾后,收錄的內(nèi)容才會到搜索結(jié)果里來。在這個期間就有一些問題了,比如A站首次發(fā)表,B站轉(zhuǎn)載。蜘蛛先訪問A站再訪問B站。而后可能先把B站的結(jié)果放出來了,而A站還在數(shù)據(jù)庫里。

所以說搜索引擎沒有收錄并不表示搜索引擎蜘蛛沒有訪問過這些內(nèi)容,也許在搜索引擎的庫存里已經(jīng)有記錄了,只是你查的時間沒有放出來而已,就像25號才放出來的內(nèi)容,但是快照是20號的,這就是搜索引擎的庫存內(nèi)容,同時這也是檢驗原創(chuàng)的核心時間點。

這種情況一般出現(xiàn)在新站與老站之間,A站發(fā)表,B站轉(zhuǎn)載,但A站在搜索引擎的信任度并不高的時候。不過只要是A站先被訪問到的,原創(chuàng)權(quán)還是A站的,這是最難分出來的情況,因為我們不知道蜘蛛先訪問哪個站,除非你知道兩個站的網(wǎng)站空間日志內(nèi)容,能看到搜索引擎對兩個頁面的訪問時間。

6、偽原創(chuàng)

——偽原創(chuàng)也會被認為是原創(chuàng)?

——大多時候是這樣的,搜索引擎蜘蛛智力相當于三歲小孩子一樣,不能明確分別這些東西,因為它的思維太程式化了。如果你的標題改過,文章的段落改過,那么蜘蛛將很難確定這篇文章是否有過收錄,也許它可以確定有部分內(nèi)容是重復(fù)的,但它也不能因為這些而將這篇文章確認為是轉(zhuǎn)載!當然,隨著搜索引擎程式設(shè)計的提高,應(yīng)該會有一個相似度的東西出來,比如文字內(nèi)容相似度超過百分之幾就會被認為是轉(zhuǎn)載。

這樣分析下來,相信大家應(yīng)該了解了吧。只是核桃自己的看法,希望大家吸收自己想要的東西,不認同的了也來提下自己的意見!

另外提幾個建議:

1、如果你的站是新站,權(quán)重不高,如何讓蜘蛛首頁找到你的頁面并放入數(shù)據(jù)庫?其實很簡單:用網(wǎng)摘、百度收藏這些工具讓蜘蛛更快的找到你的頁面!

2、大家都有過建議,就是加上自己的版權(quán)及內(nèi)容頁面的地址,別人采集的時候你就爽了,收錄雖然不會快,但最后鏈接多了,你依然是原創(chuàng)內(nèi)容。

3、發(fā)表文章等到自己收錄以后再去其它的站點進行發(fā)表,同時加上自己的原文地址,這種辦法很有保障!大站被采的機率很大!

標簽: 搜索引擎 原創(chuàng)內(nèi)容 偽原創(chuàng) 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:走向首頁之路:提升網(wǎng)頁搜索引擎排名13法

下一篇:秦劍:交換友情鏈接的一些注意事項