中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

Bing核心搜索研發(fā)部對(duì)搜索質(zhì)量的見(jiàn)解

2019-03-21    來(lái)源:盧松松博客

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

題記:這是一篇來(lái)自Bing核心搜索研發(fā)部經(jīng)理的一篇文章,本文講訴了Bing的一系列功能改進(jìn),這只是一篇普通的搜索功能改進(jìn)介紹,但通讀本文, 我們會(huì)發(fā)現(xiàn),搜索引擎會(huì)把大量精力放在研究人們?cè)谒阉鲿r(shí)犯的錯(cuò)、如何正確理解用戶的意圖、以及利用詞庫(kù)提供更精準(zhǔn)的內(nèi)容上面。所以盧松松相信,無(wú)論是bing、Google還是百度,都會(huì)這么做。

在Bing,我們承諾提供最好的搜索結(jié)果, 雖然研究小組數(shù)據(jù)挖掘?qū)<,在不斷提供我們的核心拼寫和排名算法,可現(xiàn)實(shí)是總有某些歷史上的遺留下的缺陷,這部分是因?yàn)槿藗冞^(guò)于依賴搜索所犯的錯(cuò)誤,在這篇文章中,我的同事Bill Ramsey(Bing的研發(fā)部經(jīng)理),將從三個(gè)方面介紹缺陷的發(fā)生率和嚴(yán)重性:網(wǎng)址查詢、追蹤鏈接和相關(guān)搜索。

網(wǎng)址查詢常見(jiàn)的錯(cuò)誤

這 是搜索缺陷的主要來(lái)源之一,涉及到我們所說(shuō)的網(wǎng)址查詢,例如“facebook.com”或“雅虎網(wǎng)站/郵箱”的查詢,乍一看,你可能會(huì)認(rèn)為這是一個(gè)簡(jiǎn)單 的問(wèn)題。畢竟搜索引擎(Bing)包含數(shù)十億網(wǎng)址,找到一個(gè)匹配的網(wǎng)站沒(méi)多少難度。但在現(xiàn)實(shí)中,這種類型的查詢實(shí)際上相當(dāng)復(fù)雜。因?yàn)槲覀兯腥藭?huì)用無(wú)數(shù)的 拼寫與變體。

例如,“facebook.com”就有上千個(gè)不同的變體,如“facebookc.om”,“facbook.com”,和 “ww.faceboo.omc”,除了這類拼寫錯(cuò)誤外,人們并不總是知道正確的URL。例如西南航空公司是southwest.com,但有些人試圖搜 “swair.com”達(dá)到該公司的網(wǎng)頁(yè)。同時(shí),我們通?吹降木W(wǎng)址,如“雅虎網(wǎng)站/郵箱”時(shí),正確是URL是“mail.yahoo.com”的排列。

即使我們找出了你真正的搜索意圖,但惡意網(wǎng)址或垃圾郵件發(fā)送者提出了另一個(gè)挑戰(zhàn)。它們獵取頂級(jí)域名對(duì)象如coolmathgames.com(人實(shí)際上是為coolmath-games.com)的URL。

這是我們的缺陷,我們主要通過(guò)三個(gè)領(lǐng)域來(lái)解決這類錯(cuò)誤的查詢方法:

第一, 正確識(shí)別URL,我們可以就遮擋,通過(guò)確定的網(wǎng)址,我們避免如包括像searscardcom.com垃圾結(jié)果的問(wèn)題。

第二, 進(jìn)行模擬用戶錯(cuò)誤測(cè)試,通過(guò)數(shù)十億的原模型,我們能夠解決常見(jiàn)的拼寫錯(cuò)誤的網(wǎng)址。

第三, 我們會(huì)分析,尋找像“swair.com”網(wǎng)站,使用戶最終將結(jié)束預(yù)定網(wǎng)站“southwest.com”。

另 一個(gè)例子,適用于機(jī)器學(xué)習(xí)模式,像“facebooklogin.com” 的查詢相當(dāng)于 “facebooklogin.net”,這是很常見(jiàn)的域名后綴輸入錯(cuò)誤。此外,像“bed bath and beyond.com” 輸入成 bedbathandbeyond.com。我們的模型已經(jīng)適應(yīng)了這些變化,會(huì)主動(dòng)把搜索結(jié)果修改,下面的例子是facebook的用戶:

刪除多余追蹤的相關(guān)鏈接

搜索引擎的關(guān)鍵功能之一,是查詢執(zhí)行拼寫和查詢擴(kuò)展的組件,拼寫會(huì)糾正數(shù)百個(gè)錯(cuò)誤的查詢,而搜索出現(xiàn)的詞組(下面的查詢框,表明我們改變了用戶的查詢),我 們把這種改建作為“追索”。例如,如果你輸入“關(guān)于成功英雄的事跡”,我們將顯示“包括引號(hào)的成功的英雄事跡”,但我們可能只顯示“關(guān)于成功的英雄和事 跡”,我們會(huì)架設(shè)所有關(guān)于你的意圖。

在過(guò)去,我們用同義詞作為我們追蹤鏈接的一部分,但會(huì)經(jīng)常導(dǎo)致搜索結(jié)果偏離主題,導(dǎo)致同義詞追蹤成為多余的功能, 所有我們?cè)诓粩鄶U(kuò)大“詞語(yǔ)”的定義,幫助其用戶更好的進(jìn)行匹配。

所以這項(xiàng)功能我們已經(jīng)刪除,這個(gè)附加的價(jià)值不大,當(dāng)Bing改變一些同義詞的話,追蹤鏈接可能不可能添加更多的有價(jià)值的信息,所以我們將搜索結(jié)果的顏色改為黑色。我們將繼續(xù)努力為用戶指定的搜索詞語(yǔ)提供更好的查詢。

改進(jìn)相關(guān)搜索

相關(guān)搜索,這個(gè)大家很熟悉,在人們初始搜索時(shí),我們會(huì)把相關(guān)的搜索防止搜索結(jié)果左側(cè),現(xiàn)在調(diào)整到右側(cè),例如搜索“布拉德·皮特”:

(注:Bing中國(guó)版還沒(méi)有變,百度和Google在底部。)

有時(shí)我們會(huì)查詢搜索結(jié)果的題外話。例如“AMD”會(huì)給用戶提供意想不到的搜索結(jié)果,通過(guò)改善我們的相關(guān)模型。

同時(shí),我們也取得了其他地方改進(jìn),超越有關(guān)相關(guān)搜索中的格式條款,即“KSN WeatherLab” 中的 “KSN Weather Lab”,(注:一些實(shí)驗(yàn)性項(xiàng)目,處于測(cè)試階段),并避免在安全搜索中檢索到成人內(nèi)容。

結(jié)論:

搜索引擎的有點(diǎn)在于它會(huì)始終依賴于人,而人們總會(huì)有不同缺陷的,我們做的是降低缺陷率和搜索率,希望人們可以做更少的搜索并做更多的事。

作者:Dr. William Ramsey—— bing核心搜索研發(fā)部首席開發(fā)經(jīng)理

文章來(lái)源:盧松松博客 本文地址:http://lusongsong.com/reed/488.html

標(biāo)簽: Bing網(wǎng)站管理工具 Bing搜索算法 搜索引擎優(yōu)化 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:老站長(zhǎng)交你如何兼顧SEO優(yōu)化與用戶體驗(yàn)工作

下一篇:關(guān)于2012年6月15號(hào)百度收錄減少的說(shuō)明