中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

初識(shí)推薦機(jī)制、推薦引擎

2019-04-03    來(lái)源:IBM

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

隨著互聯(lián)網(wǎng)的發(fā)展 估計(jì)大多數(shù)的產(chǎn)品都會(huì)遇到推薦機(jī)制的策劃,作為互聯(lián)網(wǎng)產(chǎn)品人員也需要研究一下推薦機(jī)制的核心算法,這篇文章是我看到的言簡(jiǎn)意賅講了一些基礎(chǔ)的推薦機(jī)制的文章,轉(zhuǎn)過(guò)來(lái)分享給大家。

信息發(fā)現(xiàn)

如今已經(jīng)進(jìn)入了一個(gè)數(shù)據(jù)爆炸的時(shí)代,隨著 Web 2.0 的發(fā)展, Web 已經(jīng)變成數(shù)據(jù)分享的平臺(tái),那么,如何讓人們?cè)诤A康臄?shù)據(jù)中想要找到他們需要的信息將變得越來(lái)越難。

在這樣的情形下,搜索引擎(Google,Bing,百度等等)成為大家快速找到目標(biāo)信息的最好途徑。在用戶對(duì)自己需求相對(duì)明確的時(shí)候,用搜索引擎很方便的通過(guò)關(guān)鍵字搜索很快的找到自己需要的信息。但搜索引擎并不能完全滿足用戶對(duì)信息發(fā)現(xiàn)的需求,那是因?yàn)樵诤芏嗲闆r下,用戶其實(shí)并不明確自己的需要,或者他們的需求很難用簡(jiǎn)單的關(guān)鍵字來(lái)表述。又或者他們需要更加符合他們個(gè)人口味和喜好的結(jié)果,因此出現(xiàn)了推薦系統(tǒng),與搜索引擎對(duì)應(yīng),大家也習(xí)慣稱它為推薦引擎。

隨著推薦引擎的出現(xiàn),用戶獲取信息的方式從簡(jiǎn)單的目標(biāo)明確的數(shù)據(jù)的搜索轉(zhuǎn)換到更高級(jí)更符合人們使用習(xí)慣的信息發(fā)現(xiàn)。

如今,隨著推薦技術(shù)的不斷發(fā)展,推薦引擎已經(jīng)在電子商務(wù) (E-commerce,例如 Amazon,當(dāng)當(dāng)網(wǎng) ) 和一些基于 social 的社會(huì)化站點(diǎn) ( 包括音樂(lè),電影和圖書分享,例如豆瓣,Mtime 等 ) 都取得很大的成功。這也進(jìn)一步的說(shuō)明了,Web2.0 環(huán)境下,在面對(duì)海量的數(shù)據(jù),用戶需要這種更加智能的,更加了解他們需求,口味和喜好的信息發(fā)現(xiàn)機(jī)制。

推薦引擎

前面介紹了推薦引擎對(duì)于現(xiàn)在的 Web2.0 站點(diǎn)的重要意義,這一章我們將講講推薦引擎到底是怎么工作的。推薦引擎利用特殊的信息過(guò)濾技術(shù),將不同的物品或內(nèi)容推薦給可能對(duì)它們感興趣的用戶。

推薦引擎的分類

圖1給出了推薦引擎的工作原理圖,這里先將推薦引擎看作黑盒,它接受的輸入是推薦的數(shù)據(jù)源,一般情況下,推薦引擎所需要的數(shù)據(jù)源包括:

要推薦物品或內(nèi)容的元數(shù)據(jù),例如關(guān)鍵字,基因描述等;

系統(tǒng)用戶的基本信息,例如性別,年齡等

用戶對(duì)物品或者信息的偏好,根據(jù)應(yīng)用本身的不同,可能包括用戶對(duì)物品的評(píng)分,用戶查看物品的記錄,用戶的購(gòu)買記錄等。其實(shí)這些用戶的偏好信息可以分為兩類:

顯式的用戶反饋:這類是用戶在網(wǎng)站上自然瀏覽或者使用網(wǎng)站以外,顯式的提供反饋信息,例如用戶對(duì)物品的評(píng)分,或者對(duì)物品的評(píng)論。

隱式的用戶反饋:這類是用戶在使用網(wǎng)站是產(chǎn)生的數(shù)據(jù),隱式的反應(yīng)了用戶對(duì)物品的喜好,例如用戶購(gòu)買了某物品,用戶查看了某物品的信息等等。

顯式的用戶反饋能準(zhǔn)確的反應(yīng)用戶對(duì)物品的真實(shí)喜好,但需要用戶付出額外的代價(jià),而隱式的用戶行為,通過(guò)一些分析和處理,也能反映用戶的喜好,只是數(shù)據(jù)不是很精確,有些行為的分析存在較大的噪音。但只要選擇正確的行為特征,隱式的用戶反饋也能得到很好的效果,只是行為特征的選擇可能在不同的應(yīng)用中有很大的不同,例如在電子商務(wù)的網(wǎng)站上,購(gòu)買行為其實(shí)就是一個(gè)能很好表現(xiàn)用戶喜好的隱式反饋。

推薦引擎根據(jù)不同的推薦機(jī)制可能用到數(shù)據(jù)源中的一部分,然后根據(jù)這些數(shù)據(jù),分析出一定的規(guī)則或者直接對(duì)用戶對(duì)其他物品的喜好進(jìn)行預(yù)測(cè)計(jì)算。這樣推薦引擎可以在用戶進(jìn)入的時(shí)候給他推薦他可能感興趣的物品。

推薦引擎

推薦引擎的分類可以根據(jù)很多指標(biāo),下面我們一一介紹一下:

推薦引擎是不是為不同的用戶推薦不同的數(shù)據(jù)根據(jù)這個(gè)指標(biāo),推薦引擎可以分為基于大眾行為的推薦引擎和個(gè)性化推薦引擎

根據(jù)大眾行為的推薦引擎,對(duì)每個(gè)用戶都給出同樣的推薦,這些推薦可以是靜態(tài)的由系統(tǒng)管理員人工設(shè)定的,或者基于系統(tǒng)所有用戶的反饋統(tǒng)計(jì)計(jì)算出的當(dāng)下比較流行的物品。

個(gè)性化推薦引擎,對(duì)不同的用戶,根據(jù)他們的口味和喜好給出更加精確的推薦,這時(shí),系統(tǒng)需要了解需推薦內(nèi)容和用戶的特質(zhì),或者基于社會(huì)化網(wǎng)絡(luò),通過(guò)找到與當(dāng)前用戶相同喜好的用戶,實(shí)現(xiàn)推薦。

這是一個(gè)最基本的推薦引擎分類,其實(shí)大部分人們討論的推薦引擎都是將個(gè)性化的推薦引擎,因?yàn)閺母旧险f(shuō),只有個(gè)性化的推薦引擎才是更加智能的信息發(fā)現(xiàn)過(guò)程。

根據(jù)推薦引擎的數(shù)據(jù)源其實(shí)這里講的是如何發(fā)現(xiàn)數(shù)據(jù)的相關(guān)性,因?yàn)榇蟛糠滞扑]引擎的工作原理還是基于物品或者用戶的相似集進(jìn)行推薦。那么參考圖 1 給出的推薦系統(tǒng)原理圖,根據(jù)不同的數(shù)據(jù)源發(fā)現(xiàn)數(shù)據(jù)相關(guān)性的方法可以分為以下幾種:

根據(jù)系統(tǒng)用戶的基本信息發(fā)現(xiàn)用戶的相關(guān)程度,這種被稱為基于人口統(tǒng)計(jì)學(xué)的推薦(Demographic-based Recommendation)

根據(jù)推薦物品或內(nèi)容的元數(shù)據(jù),發(fā)現(xiàn)物品或者內(nèi)容的相關(guān)性,這種被稱為基于內(nèi)容的推薦(Content-based Recommendation)

根據(jù)用戶對(duì)物品或者信息的偏好,發(fā)現(xiàn)物品或者內(nèi)容本身的相關(guān)性,或者是發(fā)現(xiàn)用戶的相關(guān)性,這種被稱為基于協(xié)同過(guò)濾的推薦(Collaborative Filtering-based Recommendation)。

根據(jù)推薦模型的建立方式可以想象在海量物品和用戶的系統(tǒng)中,推薦引擎的計(jì)算量是相當(dāng)大的,要實(shí)現(xiàn)實(shí)時(shí)的推薦務(wù)必需要建立一個(gè)推薦模型,關(guān)于推薦模型的建立方式可以分為以下幾種:

基于物品和用戶本身的,這種推薦引擎將每個(gè)用戶和每個(gè)物品都當(dāng)作獨(dú)立的實(shí)體,預(yù)測(cè)每個(gè)用戶對(duì)于每個(gè)物品的喜好程度,這些信息往往是用一個(gè)二維矩陣描述的。由于用戶感興趣的物品遠(yuǎn)遠(yuǎn)小于總物品的數(shù)目,這樣的模型導(dǎo)致大量的數(shù)據(jù)空置,即我們得到的二維矩陣往往是一個(gè)很大的稀疏矩陣。同時(shí)為了減小計(jì)算量,我們可以對(duì)物品和用戶進(jìn)行聚類, 然后記錄和計(jì)算一類用戶對(duì)一類物品的喜好程度,但這樣的模型又會(huì)在推薦的準(zhǔn)確性上有損失。

基于關(guān)聯(lián)規(guī)則的推薦(Rule-based Recommendation):關(guān)聯(lián)規(guī)則的挖掘已經(jīng)是數(shù)據(jù)挖掘中的一個(gè)經(jīng)典的問(wèn)題,主要是挖掘一些數(shù)據(jù)的依賴關(guān)系,典型的場(chǎng)景就是“購(gòu)物籃問(wèn)題”,通過(guò)關(guān)聯(lián)規(guī)則的挖掘,我們可以找到哪些物品經(jīng)常被同時(shí)購(gòu)買,或者用戶購(gòu)買了一些物品后通常會(huì)購(gòu)買哪些其他的物品,當(dāng)我們挖掘出這些關(guān)聯(lián)規(guī)則之后,我們可以基于這些規(guī)則給用戶進(jìn)行推薦。

基于模型的推薦(Model-based Recommendation):這是一個(gè)典型的機(jī)器學(xué)習(xí)的問(wèn)題,可以將已有的用戶喜好信息作為訓(xùn)練樣本,訓(xùn)練出一個(gè)預(yù)測(cè)用戶喜好的模型,這樣以后用戶在進(jìn)入系統(tǒng),可以基于此模型計(jì)算推薦。這種方法的問(wèn)題在于如何將用戶實(shí)時(shí)或者近期的喜好信息反饋給訓(xùn)練好的模型,從而提高推薦的準(zhǔn)確度。

其實(shí)在現(xiàn)在的推薦系統(tǒng)中,很少有只使用了一個(gè)推薦策略的推薦引擎,一般都是在不同的場(chǎng)景下使用不同的推薦策略從而達(dá)到最好的推薦效果,例如 Amazon 的推薦,它將基于用戶本身歷史購(gòu)買數(shù)據(jù)的推薦,和基于用戶當(dāng)前瀏覽的物品的推薦,以及基于大眾喜好的當(dāng)下比較流行的物品都在不同的區(qū)域推薦給用戶,讓用戶可以從全方位的推薦中找到自己真正感興趣的物品。

這一章的篇幅,將詳細(xì)介紹各個(gè)推薦機(jī)制的工作原理,它們的優(yōu)缺點(diǎn)以及應(yīng)用場(chǎng)景。

基于人口統(tǒng)計(jì)學(xué)的推薦

基于人口統(tǒng)計(jì)學(xué)的推薦機(jī)制(Demographic-based Recommendation)是一種最易于實(shí)現(xiàn)的推薦方法,它只是簡(jiǎn)單的根據(jù)系統(tǒng)用戶的基本信息發(fā)現(xiàn)用戶的相關(guān)程度,然后將相似用戶喜愛(ài)的其他物品推薦給當(dāng)前用戶,圖 2 給出了這種推薦的工作原理。

標(biāo)簽: 搜索引擎 推薦引擎 推薦機(jī)制 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:A/B測(cè)試:基本概念

下一篇:有理有據(jù)的設(shè)計(jì):QQ電腦管家設(shè)計(jì)點(diǎn)滴分享