中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

數(shù)據(jù)就是殺手锏!優(yōu)酷多端多場景下的視頻推薦系統(tǒng)探索之路

2019-04-29    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

在本篇文章里,我們將帶來視頻推薦系統(tǒng)的技術(shù)解析和最新的進展,為此,我們專門采訪到了優(yōu)酷技術(shù)推薦算法負責人夏頡。

與圖文推薦和音頻推薦不同,視頻推薦系統(tǒng)要考慮的元素更多,有的時候影響推薦結(jié)果的甚至是一些細微的因素。從 2017 年正式引入推薦算法到現(xiàn)在,優(yōu)酷推薦系統(tǒng)到底經(jīng)歷了哪些迭代與創(chuàng)新?對于視頻推薦系統(tǒng)來說,到底還有哪些可以探索的方向?本文將為你一一解答。

優(yōu)酷推薦系統(tǒng)概況

夏頡告訴記者:“優(yōu)酷是在 2017 年下半年開始進行算法化升級的。”

“剛開始是在某些重點場景實現(xiàn)單場景的千人千面,當我們在這些場景拿到很多不錯的收益之后,才開始逐漸在全站推廣。”夏頡說,直到去年,優(yōu)酷才逐漸將單場景的推薦進行了多端、多場景上進行的融合,形成全網(wǎng)站一致化的推薦體驗,用戶現(xiàn)在在頁面上看到的推薦內(nèi)容就是在這時完成的。

至于為什么會在去年才逐漸向全站推廣,夏頡解釋說,視頻推薦系統(tǒng)與文字推薦系統(tǒng)還是有很多不同的。由于文字提取主題和標簽(tag)的方式更加容易,加之 NLP 技術(shù)發(fā)展了這么多年,技術(shù)理論與工業(yè)實踐已經(jīng)到達了相對可用的級別,所以實現(xiàn)起來會比較容易。

而計算機視覺領(lǐng)域雖然在近幾年取得了比較迅速的發(fā)展,但還是停留在比較具象的層次,比如識別屋子里有一把椅子,或者識別桌子上有一瓶水等等。而對于畫面中的人物正在進行的活動主題——譬如“屋子里的人正在家長里短或者激烈爭吵”等等,推薦系統(tǒng)對這類主題的建模與識別還是相對來說比較困難的。

另外,夏頡補充道,用戶對文章的消費很多時候是因為文章的主題,但是對于視頻的消費是很多元化的,甚至可能是因為其中某一個很不起眼的因素所吸引。可能是因為某個場景的背景音樂,或者說主角使用的某個道具等等。所以,如何去判斷一段視頻中,哪些因素是吸引用戶的關(guān)鍵,對于視頻推薦系統(tǒng)來說是非常重要的。

“數(shù)據(jù)就是殺手锏”

在介紹完優(yōu)酷推薦系統(tǒng)的概況后,記者進一步向夏頡了解了推薦系統(tǒng)技術(shù)層面的內(nèi)容。

依托于阿里巴巴的數(shù)據(jù)儲備,優(yōu)酷擁有了大量的數(shù)據(jù),并繪制出了更加精準的文娛知識圖譜,夏頡說,數(shù)據(jù)就是優(yōu)酷推薦系統(tǒng)的殺手锏。

首先,從算法上來說,夏頡表示,對于視頻推薦系統(tǒng)來說,最重要的是通過多模態(tài)的視頻分析和內(nèi)容標簽的提取來充分理解視頻;其次,要建立一個文娛領(lǐng)域的知識圖譜,譬如某位男明星和女明星之間是夫妻關(guān)系,在用戶觀看這位男明星的視頻時,是否能推薦他妻子的相關(guān)視頻給用戶;另外,怎樣把知識圖譜更好地應用在推薦系統(tǒng)的召回和排序中,也非常重要;同時,怎樣把有聯(lián)系的用戶之間建立一個行為網(wǎng)絡,通過這個行為網(wǎng)絡更好地進行用戶之間的熟人視頻消費內(nèi)容推薦,也是優(yōu)酷在考慮的問題。

夏頡以用戶畫像為例進行了更詳細的介紹。在優(yōu)酷的用戶群中,有一類叫做“小嫂子”,組成這個群體的核心成員是一些全職的家庭主婦,在進行視頻推薦的時候,更多地會為這類用戶推薦家庭倫理情感類的視頻。

對于毫無數(shù)據(jù)的新用戶,推薦算法又是如何進行精準推薦的呢?

夏頡說,這是一個非常有意思的話題,如果單獨對優(yōu)酷來講,這會是一個大問題,但是現(xiàn)在,優(yōu)酷是阿里經(jīng)濟中很重要的一環(huán),這個問題就不再是難題了。

阿里巴巴基本上覆蓋了當前大多數(shù)中國人線上線下的消費,例如某個用戶可能在大麥上買過某場演唱會的票,或者可能在淘票票上買過某部電影的票,亦或者他可能在天貓上經(jīng)常購買某一類動漫的手辦等等,通過用戶在衣食住行上的偏好或消費習慣,哪怕他沒有進行內(nèi)容消費,也是可以通過這些信息對他做出比較準確的推薦。

如果這個用戶甚至都不在阿里經(jīng)濟覆蓋范圍之內(nèi),也有很多別的辦法可以進行畫像,比如從人口屬性判斷,用戶來自哪個城市、屬于哪個年齡層等等,根據(jù)和他相似人群的觀看習慣,仍然可以為新用戶做一些個性化的推薦。

除了算法上的優(yōu)化,在推薦方式上,優(yōu)酷也是下了一番功夫的。

夏頡舉例說,在視頻封面上,優(yōu)酷已經(jīng)開始大規(guī)模使用個性化配圖推薦了。

夏頡告訴記者,封面?zhèn)性化配圖是在 2018 年下半年的時候大規(guī)模展開的。優(yōu)酷對于上百部影視作品,每部都會配有至少十張以上的封面圖,由設(shè)計進行產(chǎn)出,而算法會根據(jù)用戶不同的行為消費偏好,推薦他可能更感興趣的封面圖,促進用戶對內(nèi)容的轉(zhuǎn)化和消費。

而對于短視頻,夏頡表示,優(yōu)酷內(nèi)部也有足夠的技術(shù)儲備:“我們現(xiàn)在能夠智能生成短視頻的封面圖,并根據(jù)用戶對短視頻的消費進行個性化分發(fā),在線上取得了很不錯的收益。”

對于剛剛添加的新視頻,優(yōu)酷也能做到實時推薦。夏頡說,這一功能的實現(xiàn)得益于內(nèi)部的一套冷啟動算法系統(tǒng),該系統(tǒng)能夠保證每天百萬級的短視頻,在 24 小時內(nèi)冷啟動完畢,從而實現(xiàn)精準推薦。

除了上面提到的各種技術(shù),近年來比較流行的強化學習、圖像學習等技術(shù)也已經(jīng)在優(yōu)酷內(nèi)部進行實驗,或許在不久之后,用戶就能體驗到這些技術(shù)帶來的便利。

未來規(guī)劃

由于推薦系統(tǒng)技術(shù)也在不斷迭代,在采訪的最后,夏頡也談了談自己正在研究的方向和對推薦系統(tǒng)未來發(fā)展的一些規(guī)劃。他表示自己也在關(guān)注著很多領(lǐng)域的進展,希望將最新的技術(shù)應用在推薦系統(tǒng)中。

比如多模態(tài)視頻內(nèi)容分析,它不僅可以對一些具象進行分析,還可以對一些抽象概念進行提取,就像前文中說的,可以理解某一個場景中正在發(fā)生什么事;另外,基于圖計算的推薦系統(tǒng)也是夏頡正在研究的方向。

夏頡告訴記者,阿里文娛是一個覆蓋了全端全場景的娛樂消費平臺,怎么樣在多端、多場景下做到消費體驗一致化,并盡可能的提升用戶在整個娛樂生態(tài)系統(tǒng)里的消費體驗和市場,是一個需要長期不斷探索的問題。

標簽: [db:TAGG]

版權(quán)申明:本站文章部分自網(wǎng)絡,如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:人工智能之可視化--應用篇

下一篇:帝國理工:如何用AI解決80%?漆t(yī)生擔憂的心律裝置移植手術(shù)難題