中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

搜索引擎優(yōu)化第一課:搜索與檢索基礎(chǔ)之索引

2019-03-19    來(lái)源:my.cneduit.com

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

這是我做的第一課簡(jiǎn)單的介紹小我是小鵬90年出生做SEO已經(jīng)三年了都是在積累一些經(jīng)驗(yàn)和不停的學(xué)習(xí),出這個(gè)教程只是為了促使自己更加努力的去學(xué)習(xí)不在頹廢下去。

聲明:我只做文字教程不出任何語(yǔ)音以及視頻,不承接任何SEO項(xiàng)目。

我這次要講的是基礎(chǔ)課程先從索引開(kāi)始:

索引的主要分為:結(jié)構(gòu)、分析、組織、存儲(chǔ)和檢索的領(lǐng)域。

最初的索引基于文本:

所有的搜索引擎都是圍繞以上的幾個(gè)主題在研發(fā)以及擴(kuò)展,從20世紀(jì)50年代開(kāi)始,就把聚焦點(diǎn)放在文本上(text)和文本形式上的文檔(text document)。

文本比較:

定義一個(gè)詞、句子(新聞)、段落或者整個(gè)新聞報(bào)道的意義,比定義一個(gè)數(shù)據(jù)庫(kù)內(nèi)的名稱要難的多,因此文本比較對(duì)于索引來(lái)說(shuō)是非常重要的,也是最為困難的。如果換成我們來(lái)比較一篇文章是非常簡(jiǎn)單的,肉眼就是非常容易辨別文章的質(zhì)量的好壞,而換成搜索引擎他們的理解能力卻是相當(dāng)差,所以說(shuō)搜索引擎一直都在模擬人的行為來(lái)判斷文章的核心也就 是在模擬人的行為來(lái)理解文章和建模,精確的實(shí)行這種比較,是信息檢索的核心。

特別:

圖片、視頻、音頻(音樂(lè)和語(yǔ)音)。這些媒體像文本一樣,其內(nèi)容都是通過(guò)它的描述來(lái)做比較的,但是對(duì)媒體內(nèi)容的直接比較技術(shù)正在不斷進(jìn)步,例如圖片,都可以對(duì)于顏色驚醒大致上的區(qū)分。

用戶的查詢方式:

這種查詢的方式可以稱之為特殊搜索(ad hoc search)因?yàn)橛脩舨樵兊姆秶浅>薮蠖鴮?shí)現(xiàn)是沒(méi)有任何預(yù)測(cè)性,所以就產(chǎn)生了,過(guò)濾、分類、問(wèn)答。

過(guò)濾:也就是跟蹤,根據(jù)一個(gè)人的行為去判斷檢索用戶的愛(ài)好或者說(shuō)是興趣,根據(jù)他的興趣發(fā)現(xiàn)符合其興趣的報(bào)道活著檢索結(jié)果。

分類:分類一般都是基于一套預(yù)先定義好的標(biāo)簽或者類別給文檔打上標(biāo)記。

問(wèn)答:例如:“世界上人口最多的國(guó)家是那個(gè)?” 這個(gè)不多說(shuō),你搜索下就明白。

相關(guān)性:

相關(guān)性也是一個(gè)重要的問(wèn)題英文稱之為:relevance。相關(guān)性在搜索引擎中是非常重要的一個(gè)環(huán)節(jié),盡管聽(tīng)上去非常簡(jiǎn)單,但是當(dāng)一個(gè)人去判斷一篇文章是否相關(guān),有許多因素會(huì)影響到他的決策。中文檢索非常復(fù)雜因?yàn)檎Z(yǔ)言的表達(dá)方式非常多,通過(guò)不同的詞語(yǔ),表達(dá)同一個(gè)概念,所以才會(huì)出現(xiàn):此表不匹配問(wèn)題。

話題相關(guān)和用戶相關(guān)這兩個(gè)概念必須區(qū)分,只有區(qū)分才能合理的做到基本的優(yōu)化,這也是兩個(gè)完全不同的概念。如果一個(gè)文本與查詢的話題相關(guān)那就意味著與查詢的話題相關(guān),就是說(shuō)兩者有相同的話題。例如,焦作暴雨天氣相關(guān)的新聞報(bào)道就可以查詢“焦作惡劣天氣”是相關(guān)話題。如果用戶搜索“焦作天氣”這又是另外的一個(gè)概念,他想查詢的并不是暴雨相關(guān)的新聞而是,用戶相關(guān)的天氣預(yù)報(bào),很簡(jiǎn)單的例子我想大家能很快就明白吧?

相關(guān)性模型非常多我在這里只是簡(jiǎn)單的介紹了兩種常用的也是比較重要的,還有一些所謂的優(yōu)化工具就是依賴搜索引擎的,點(diǎn)擊流數(shù)據(jù)來(lái)提升網(wǎng)站排名,這個(gè)非常常見(jiàn)但是一旦停止使用你的點(diǎn)擊流數(shù)據(jù),那網(wǎng)站就危險(xiǎn)了,會(huì)牽連其他的排名。這都是網(wǎng)站的數(shù)據(jù)異常造成的。

今天這一篇我們就講到這里其他的怎樣判斷搜索引擎的性能這里就不多說(shuō),因?yàn)閷?duì)大家的幫助不大,一般都是從查詢的吞吐量、用戶的交互性,索引的速度,相應(yīng)的時(shí)間都是有著密切關(guān)系,新聞這里注意了都會(huì)有一個(gè),覆蓋率和時(shí)新性上的判斷等。

結(jié)束語(yǔ):數(shù)據(jù)的集合才能看清楚數(shù)據(jù)的曲線,每個(gè)網(wǎng)站都有自己的數(shù)據(jù)曲線。

(版權(quán)所有:my.cneduit.com ,轉(zhuǎn)載必須聲明出處)

標(biāo)簽: 搜索引擎優(yōu)化 索引 檢索 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:從“外鏈為皇 內(nèi)容為王”來(lái)分析如何打造高質(zhì)量論壇簽名

下一篇:網(wǎng)站優(yōu)化絕對(duì)不難 秘笈就是真實(shí)自然