中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

Google工程師 講述網(wǎng)頁搜索排名背后的技術(shù)

2019-03-05    來源:Chinaz用戶投稿

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬Linux鏡像隨意使用

這是 Google 工程師 Amit Singhal 發(fā)表在 Google 官方博客的一篇文章,講述了 Google 搜索排名背后的一些技術(shù),涉及到 Google 對(duì)網(wǎng)頁,對(duì)語義,對(duì)用戶意圖的理解。

Google 搜索排名的核心技術(shù)源自已有50年歷史的學(xué)術(shù)課題 Information Retrieval (IR),IR 技術(shù)使用統(tǒng)計(jì)學(xué)原理對(duì)文字的使用頻率等屬性進(jìn)行研究并對(duì)結(jié)果進(jìn)行排名。建立在 IR 理論上的 Google 搜索同時(shí)借助鏈接,網(wǎng)頁結(jié)構(gòu)等等技術(shù)形成獨(dú)特的搜索技術(shù)。

理解網(wǎng)頁:

Google 多年來在網(wǎng)絡(luò)爬蟲與索引系統(tǒng)上投入巨資,因此,Google 擁有非常龐大并且是最新的網(wǎng)頁索引,除此之外,Google 還使用一些最新技術(shù)提高索引質(zhì)量,比如,他們開發(fā)了一種技術(shù),可以在字面意思之外理解一個(gè)網(wǎng)頁所表達(dá)的重要概念,人們使用意大利語言搜索 "galleria sprovieri londra",會(huì)找到倫敦的 Sprovieri Gallery,盡管 Sprovieri Gallery 主頁上既沒有 London,也沒有 Londra 字樣。在美國,人們搜索 "cool tech pc vancouver, wa",會(huì)找到 www.cooltechpc.com,然而 www.cooltechpc.com 的主頁上沒有任何文字表明他們位于 Vancouver。其它技術(shù)包括,區(qū)分一個(gè)網(wǎng)頁中的重要或非重要文字,以及網(wǎng)頁內(nèi)容的新鮮度。

理解語義:

Google 可以通過用戶提供的幾個(gè)搜索關(guān)鍵詞,理解用戶的真實(shí)意圖。他們?cè)谄磳懠m正,詞義,以及概念分析方面處于非常領(lǐng)先的位置。很多人都或多或少體驗(yàn)過 Google 的拼寫糾正功能,比如搜索 "kofee annan",Google 會(huì)問你搜索的是否 "kofi annan",然而,當(dāng)有人搜索 "kofee beans",Google 會(huì)糾正成 "coffee beans"。(Google 事實(shí)上已經(jīng)在嘗試語義技術(shù) - 譯者)

詞義是 Google 嘗試?yán)斫獠樵冋Z義的基礎(chǔ),也是 Google 遇到的最大難題。一些在人看來顯而易見的東西,機(jī)器卻很難自動(dòng)處理。用戶并不想對(duì)使用什么詞匯進(jìn)行查詢而費(fèi)神,人們甚至壓根不知道該使用什么進(jìn)行查詢。在這種時(shí)候,Google 的詞義系統(tǒng)便可以發(fā)揮作用,詞義系統(tǒng)可以對(duì)查詢語句進(jìn)行非常復(fù)雜的修正,比如,查詢 "Dr Zhivago" 的時(shí)候,Google 知道 Dr 代表 Doctor ,而查詢 "Rodeo Dr" 的時(shí)候,Dr 代表 Drive。用戶搜索 "back bumper repair" 的時(shí)候,結(jié)果是 rear bumper repair,而搜索 "Ramstein ab",Google 能夠?qū)?ab 理解成 Air Base,"b&b ab" 會(huì)理解為 Alberta 的 Bed and Breakfasts 。Google 將這種詞義理解系統(tǒng)發(fā)展到上百種不同語言。

Google 在搜索排名中使用的另一項(xiàng)技術(shù)是概念識(shí)別,該技術(shù)可以對(duì)查詢的內(nèi)容進(jìn)行概念識(shí)別,比如,我們查詢 "new york times square church",Google 知道我們實(shí)際上查詢的是紐約時(shí)代廣場(chǎng)上的那座著名教堂,而不是紐約時(shí)報(bào)中的某篇文章。概念識(shí)別技術(shù)并不止這些,Google 還對(duì)其進(jìn)行加強(qiáng)以正確地識(shí)別語義,比如,搜索 "PC and its impact on people",事實(shí)上是搜索計(jì)算機(jī)對(duì)社會(huì)的影響。Google 的搜索分析算法中這類技術(shù)比比皆是,而且面向幾乎所有語言。

理解用戶:

Google 嘗試?yán)斫庥脩舻哪康氖菫橛脩舴祷厮麄冋嬲枰慕Y(jié)果,而不是他們?cè)谒阉髡Z句中所說的東西。該技術(shù)基于一個(gè)世界級(jí)的本地化系統(tǒng),外加先進(jìn)的個(gè)性化技術(shù),以及各種用戶意圖識(shí)別技術(shù)。

Google 對(duì)本地結(jié)果的重視體現(xiàn)在他們的本地化工作中。同樣一個(gè)查詢語句在不同國家會(huì)返回不同結(jié)果,比如,查詢 "bank]",在美國返回的是銀行,而英國則可能是 Bank Fashion 的服裝連鎖店,或者英國的銀行,而在其它英語國家,如澳大利亞,加拿大,新西蘭,南非,返回的則應(yīng)仍舊是當(dāng)?shù)氐你y行。如果你在一些非英語國家查詢這個(gè)詞,象埃及,以色列,日本,俄羅斯,沙特,瑞士,返回的結(jié)果將更有趣。就象 Football 在美國和英國表示不同的運(yùn)動(dòng)項(xiàng)目一樣,同一個(gè)詞在不同國家查詢的結(jié)果可能截然不同。

個(gè)性化查詢是 Google 另一項(xiàng)先進(jìn)搜索技術(shù),一個(gè)已經(jīng)登錄的用戶,如果開通了 Web History 服務(wù),隨著他查詢時(shí)間的增長,Google 會(huì)根據(jù)他的查詢歷史,自動(dòng)調(diào)整返回的結(jié)果,比如,一個(gè)經(jīng)常查詢 Football 相關(guān)話題的人,會(huì)逐漸從 Google 得到更多足球相關(guān)的結(jié)果。如果你青睞某個(gè)購物站返回的結(jié)果,在以后的查詢中,會(huì)從那個(gè)購物站得到更多結(jié)果。

Google 在返回用戶真正想要的結(jié)果方面的另一個(gè)例子是,假如你搜索 "chevrolet magnum",我們知道 Magnum 不是 Chevrolet 產(chǎn)的,是 Dodge 產(chǎn)的,Google 會(huì)自動(dòng)返回 dodge magnum 的結(jié)果。還有一個(gè)例子,有人搜索 "bangalore",不僅返回 Bangalore 這個(gè)城市的主頁,而且返回 Bangalore 的地圖,以及一些與 Bangalore 市景,交通相關(guān)的視頻,這些視頻會(huì)讓你有身臨其境的感覺。

本文國際來源:http://googleblog.blogspot.com/2008/07/technologies-behind-google-ranking.html

中文翻譯:COMSHARP CMS 官方網(wǎng)站

標(biāo)簽: Google PageRank 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:搜索引擎的一個(gè)秘密 關(guān)于網(wǎng)站收錄權(quán)重的評(píng)定

下一篇:CSSBBS百度SEO優(yōu)化和建站經(jīng)驗(yàn)雜談!