中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

原創(chuàng)首發(fā)頁面準確識別 搜索引擎義務并非恩賜

2020-04-28    來源:SEO云南

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

2010年4月13日,在百度貼吧站長俱樂部中,知名SEO專家ZAC在“代人提問原創(chuàng)內容不能被識別”帖子中發(fā)問道:“自己的原創(chuàng)內容排名常常比不過轉載或抄襲的,站長能做些什么預防或改進?我的站每天都更新原創(chuàng)內容,而百度每天也都更新,但是其他人的轉載被收錄了以后,我的文章就搜索不到了。我堅持了近4個月的原創(chuàng),但百度仍然把我扔到了500多位!”

兩年前ZAC代表站長就原創(chuàng)收錄問題與代表百度的Lee之對話

兩年多過去了,上面提問中所陳述情況依舊毫無改觀,甚至越發(fā)惡化,各種“復制采集偽原創(chuàng)”有價值原創(chuàng)內容頁面輕易地被百度網(wǎng)頁搜索以關鍵詞索引方式推薦給搜索網(wǎng)友,而原創(chuàng)內容首發(fā)網(wǎng)站卻名落孫山。這在客觀上縱容了那種瞄準百度缺陷,以“復制采集偽原創(chuàng)”為基礎所謂SEO的不斷泛濫。

不出所料的是,在今年8月10日的百度“站長門診開放日”活動中,原創(chuàng)識別問題又成為了各位站長、SEOER不斷向百度搜索工程師Lee追問的問題。

同樣不出所料的是,百度搜索工程師Lee的回答仍是兩年前回答“這個,只能說百度的策略還不是很完善,我們也一直在改進”的翻版——“我們正在設計一套較完善的原創(chuàng)識別算法”。

而關注百度動態(tài)的人士可以很輕易地就發(fā)現(xiàn),百度Lee“我們正在設計一套較完善的原創(chuàng)識別算法”的回答完全就是對7月2日百度網(wǎng)頁搜索反作弊團隊《針對低質量站點的措施已經(jīng)生效》“打擊低質網(wǎng)站(偽原創(chuàng)與無原創(chuàng)網(wǎng)站)措施已經(jīng)生效”的全面否定——大家還記得,當時《針對低質量站點的措施已經(jīng)生效》中氣宇軒昂地說道:“對提供優(yōu)質、原創(chuàng)資源的站長來說,因為我們降低甚至清除了低質量站點的排名,你們將從百度得到更多的流量”。

但不到兩個月之后,百度搜索工程師Lee的回答就完全否定了百度網(wǎng)頁搜索反作弊團隊的說法,這真的讓人大跌眼鏡。

并且,時隔兩年兩次面對“原創(chuàng)內容”識別提問,百度Lee都采取了“環(huán)顧左右而言他”的方法敷衍應付:兩年前Lee的回答為“從用戶體驗角度,有些轉載未必比原創(chuàng)差……只是國內的轉載,很多是掐頭去尾,使原創(chuàng)者比較受傷”,更多針對的是國內轉載不規(guī)范的問題;而今年百度Lee的回答則是:“(百度接到的聲稱自己是原創(chuàng)投訴)80%多都是無效的,甚至大量聲稱老中醫(yī)3-5天治愈絕癥的網(wǎng)站,通篇內容讀不通,聲稱自己是高質量的網(wǎng)站”。

無可否認,Lee所說的都是事實,但真實的細節(jié)累加并不等于真實的整體,這些普遍情況的真實存在并不等于中國網(wǎng)絡界就沒有高質量原創(chuàng)內容存在,更不是百度無法識別網(wǎng)站原創(chuàng)首發(fā)的理由。俗話說“沒有金剛鉆,別攪瓷器活”,百度Lee這樣的表態(tài)只能證明百度的原創(chuàng)識別與去除重復頁面能力沒有絲毫進步。

必須強調的是,了解識別原創(chuàng)頁面能力差是所有搜索引擎的軟肋之后,許多草根原創(chuàng)者都在文章末尾處添加了版權說明標注首發(fā)網(wǎng)址,同時以高質量行業(yè)網(wǎng)站投稿的“內容同步”方式引導搜索引擎及轉載站長——雖然所獲得鏈接更多的是純文本鏈接,但百度搜索工程師Lee所說“我們把問題明確一下:是否能識別和處理純文本形式的鏈接(非標簽)?答案是可以的,搜索引擎的spider需要及時發(fā)現(xiàn)和抓取互聯(lián)網(wǎng)上的鏈接,至于鏈接是什么形式,并不重要”給了他們信心。

可讓這些站長們大失所望的是,就在大量業(yè)內權威投稿轉載網(wǎng)站沒有百度Lee所說“掐頭去尾轉載”,且高權重投稿或轉載網(wǎng)站網(wǎng)頁生成及被搜索引擎收錄時間明顯早于“復制采集偽原創(chuàng)”網(wǎng)站的情況下,還是出現(xiàn)了大量原創(chuàng)首發(fā)頁面被百度忽略,“復制采集偽原創(chuàng)”網(wǎng)站排名居高不下——其中很多頁面還是隨便截取文章一部分,沒有完整表達文章主題,根本無法達到百度所標榜之“更好的用戶體驗”標準。

必須看到的是,雖然原創(chuàng)頁面的識別認定一直都是搜索引擎的軟肋,但并不是所有搜索引擎面對眾多高權重URL指向原創(chuàng)首發(fā)頁面的表現(xiàn)都如同百度們一樣糟糕。正如國內知名SEOER王通所言,在同樣面對中國網(wǎng)絡“復制采集偽原創(chuàng)”泛濫的情況下,對于有版權聲明網(wǎng)址指引的原創(chuàng)首發(fā)頁面(加之發(fā)布時間、鏈接普遍性及鏈接網(wǎng)站頁面權重等標準),谷歌就沒有出現(xiàn)號稱“最懂中文”的百度那樣一敗涂地的情況——相關搜索靠前位置大片被復制采集偽原創(chuàng)頁面占領,原創(chuàng)首發(fā)頁面無影無蹤現(xiàn)象。

這說明,“最懂中文”的百度在關鍵詞索引將網(wǎng)址推薦給搜索網(wǎng)友之前,必須完成的原創(chuàng)識別工作與去除重復頁面工作(以甄別確定重點推薦的高質量信息頁面及重要補充頁面)基本沒有完成——原因是技術水平十分低下,急亟迎頭趕上,而百度Lee的說法只不過是不斷地為百度尋找托詞。

而且,相比之下,谷歌識別原創(chuàng)首發(fā)地址更良好的表現(xiàn)證明,百度并不在乎原創(chuàng)首發(fā)頁面,它在乎的只是更多原創(chuàng)內容——卻缺乏應有的版權意識,本人認為,這正是百度長期以來識別原創(chuàng)網(wǎng)站算法落后的最主要原因,“非不能也,是不為也”。

無怪乎,國內知名SEOER王通“百度628調整,就是為了打擊原創(chuàng)網(wǎng)站”的言論一出,許多站長、SEOER于心有戚戚焉。

事實上,原創(chuàng)首發(fā)頁面的認定技術如果能有較大提高,可以幫助搜索引擎反作弊能力的大幅提高,直接挫敗那些為牟利以各種方式欺騙搜索引擎的SEOER們的圖謀,給認真致力于高質量原創(chuàng)內容者信心。

只有百度以實際行動尊重眾多中小原創(chuàng)網(wǎng)站站長的勞動,鼓勵他們不斷地發(fā)揮聰明才智,進行原創(chuàng)工作,才能引導更多一天鉆頭覓縫于“復制采集偽原創(chuàng)”的站長、SEOER將精力投入到“最能體現(xiàn)網(wǎng)站核心價值”的原創(chuàng)內容上面。對于百度,這一步雖然很艱難,但卻是有利于搜索引擎未來發(fā)展的一步大棋。

并且,不得不提醒百度網(wǎng)頁搜索的是,盡快以更為合理的算法圓滿解決站長們所反映“原創(chuàng)內容收錄問題”,并不是百度對眾多草根站長們的恩賜(知名網(wǎng)站根本不尿百度,淘寶直接屏蔽百度),而是現(xiàn)行《版權法》等相關法律要求百度必須履行的“基本義務”。百度們不能自我感覺太過于良好了。

何去何從,路在腳下,全憑搜索引擎自己選擇(本文由gouyn12原創(chuàng)首發(fā),版權所有,文責自負,轉載請以鏈接形式標明文章首發(fā)出處http://www.gouyn12.com/cnnet/327.html)。

標簽: 百度站長俱樂

版權申明:本站文章部分自網(wǎng)絡,如有侵權,請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:360搜索引擎能否給苦逼的站長們帶來希望

下一篇:還在談原創(chuàng),百度都不談了