中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

美國資深數(shù)據(jù)科學(xué)家暢聊:數(shù)據(jù)分析與北美電商

2019-02-22    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

電商現(xiàn)在已經(jīng)是無所不在了,可以說是貫穿于大家的吃穿住行,什么都和它離不開。電商可以被簡單的定義為:Business model enabling a firm or individual to conduct businesses。這篇文章我們來講數(shù)據(jù)科學(xué)與AI技術(shù)在電商中的運用。

數(shù)據(jù)科學(xué),也就是數(shù)據(jù)驅(qū)動科學(xué)(data driven class),是一種跨科學(xué)的方法。通常它結(jié)合多種算法和系統(tǒng)領(lǐng)域,被使用于提供各種形式的數(shù)據(jù)支持和連接。

 

 

一次交易行為對于電商來說的第一步是Customer在電腦前瀏覽物品下單,放在購物車。然后是第二步的刷卡、買單,到之后的這個單被接收,刷卡成功,確認(rèn)郵件的發(fā)送和接收,到最后的warehouse打包準(zhǔn)備及發(fā)貨。

整個流程會產(chǎn)生很多的流量數(shù)據(jù)(Traffic Data)。比如說用戶的行為,包括Impression(看到的印象流量)、Click Though(點擊的行為)、Session(花多少時間在看相應(yīng)的物品)、Email Activity(郵件端的traffic),包括打開點擊,訂閱,或者取消訂閱等等,這些都是流量數(shù)據(jù)。

相應(yīng)的交易數(shù)據(jù)有這樣幾種:Order History(下單的記錄,買賣過什么樣的東西)、Membership Subscription(會員訂閱,從什么時間開始、訂閱多久、是什么樣的會員)、等等。

最后還有個人相關(guān)的用戶信息數(shù)據(jù),分為Demographic和Geographic。Demographic是人口調(diào)查,比如用戶的性別、年齡、還有收入情況,住在哪里、有沒有買房、有沒有車,這些都算人口普查數(shù)據(jù)。Geographic就是地理信息,常用住址是住在大城市,還是二三線城市,或者是在郊外,這些是地理信息。

 

 

同樣的,每個顧客都會有自己的Traffic/Transaction Data,就是瀏覽的信息和下單交易的數(shù)據(jù)。在電商里有很多種不同的數(shù)據(jù),數(shù)據(jù)科學(xué)AI技術(shù)就應(yīng)用在這里,就是從數(shù)據(jù)里面提取出知識和一些有用的見解。

實例分析:三個電商應(yīng)用AI的實例:

Amazon GO(今年年初亞馬遜才正式開放的無人售貨店)

Smart Speaker(現(xiàn)在已經(jīng)比較流行的智能音響)

Netflix Artwork (做關(guān)于影片的用戶推薦)

Amazon GO 是一家無人商店,國內(nèi)像阿里巴巴也有開這種相應(yīng)的無人商店,使用的是差不多的技術(shù)形態(tài)。Amazon Go目前只在西雅圖開了一家試用店。進門是需要排隊的,因為想去看的人太多。

 

 

像這一幅圖展示的,這家店沒有營業(yè)員在出門的時候結(jié)算。它主要的技術(shù)是Computer Vision做動態(tài)識別、用Deep learning做動作的一些行為判斷、還有各種Sensor、Sensor Fusion進行會員身份和物品的探測。

進門之前顧客要下載一個Amazon GO的APP,登陸以后就可以通過Sensor把用戶的形態(tài)、相關(guān)的信息、買過什么東西、是會員還是非會員等等信息都查到。掃了門口的二維碼以后,用戶就可以進入。進去以后天花板上到處都是攝像頭,照片里沒有體現(xiàn),但是顧客的一舉一動都是被完全記錄下來的。

那么Computer Vision(動態(tài)識別技術(shù))的技術(shù)是什么原理呢?它主要的技術(shù)核心是用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network)。

 

 

舉一個簡單的例子:一幅圖片從最基礎(chǔ)開始可以分成三個顏色:RGB(紅綠藍);有些時候你可能會有些圖案,有些透明度:RGBA。每個RGB都會有相應(yīng)的數(shù)值。卷積實際上是對每一層的顏色做了一個濾鏡。

用3×3的濾鏡,濾鏡的意思是把圖像的各個框框角角的特征抽取出來。像圖中所描述的,它將3×3的濾鏡從左到右規(guī)定一個Stride(步數(shù))。從左到右再從上到下,全部掃出來以后,相應(yīng)的圖層就會簡化成一個Convolved Feature,就是一個縮小的矩陣。那這種矩陣通?梢宰鼍矸e層(Convolved)。

套用濾鏡做卷積,也可以簡單直接地取它的最大值。這里的例子是2×2的濾鏡,和兩步的部署。每個2×2的框里就取最大的值,像左上角的框我們就取6,相應(yīng)右上角的取8。每一個圖層里面取最大的值。這種做法可以幫助減小整個圖片,把圖片的各種顏色的各種特征提取出來。

從這里看到,用不同的濾鏡和不同的步數(shù)可以得到縮小化的矩陣圖。然后可以使用相應(yīng)的圖層,做convolution和pooling,并放到不同的矩陣?yán)。這樣直接輸出結(jié)果到下一層神經(jīng)網(wǎng)絡(luò),就可以把圖片里從各個角度、各個方向相應(yīng)的特征都提取出來。

 

 

上圖的例子就是卷積神經(jīng)網(wǎng)絡(luò)的功能:它把一幅靜態(tài)的圖片分成3個圖層以后,每個圖層做卷積和max pooling,然后提取圖片最大的特征,再做幾次的卷積和max pooling。卷積神經(jīng)網(wǎng)絡(luò)還可以做不同的結(jié)合來保證識別范圍的廣度。最后的輸出結(jié)果是這個圖里面是有狗還是有貓,還是有船和鳥。

每一個識別都帶有一個概率值,概率值越高說明這個圖片里有這個物品的概率就越大。極高的概率就可以確認(rèn)這個圖片里面有什么樣的物品。

卷積神經(jīng)網(wǎng)絡(luò)是一個靜態(tài)的圖片的一個判斷,但實際上Amazon GO商店里的顧客都是移動的。大家挑選商品的時候都是走來走去的,所以亞馬遜必須要進一步的利用CNN卷積神經(jīng)網(wǎng)絡(luò)的動態(tài)識別。

 

 

動態(tài)識別算法近十年發(fā)展的很快。最初的Sliding Windows(一種滑動窗口的算法)的概念是:每一幅靜態(tài)的圖片里,定義一個像濾鏡一樣的窗口,在這個窗口從左到右,從上到下不斷的掃描,每個窗口都會做一個判斷,每個小窗口都有對應(yīng)的圖片,來判斷這里面有沒有想要的物品。上圖是判斷圖片里有沒有車;瑒哟绑w算法中的窗體是固定掃動,一直掃描到找到目標(biāo)物體為止。比如這輛車的匹配度是零點九幾,那么通過找出最高概率的窗口就可以確認(rèn)這里確實是有一輛車。這個算法的缺點效率非常的低下。因為要把一幅大圖分解成很多小圖,并不斷的掃描。這對計算能力來說的確是個挑戰(zhàn)。

最近幾年來比較流行的算法叫做YOLO,就是You Only Look Once(只掃一眼)。任意一幅圖片或視頻中某個時段的樣片,YOLO可以很快的去判斷這個圖片里面的物體。YOLO主要的精神是把圖片按照網(wǎng)格(grid)分析。通過在每個網(wǎng)格里判斷物品的重心(Center),可以精確的定位物體在圖片中的位置。以剛剛的車子作為例子,YOLO判斷這些網(wǎng)格的重心在哪里。同樣它也會判斷小網(wǎng)格里面有沒有目標(biāo)物體,如果有的話就會提供一個很高的概率。

當(dāng)把這些發(fā)現(xiàn)有車的小窗口全部合在一起,變成一個大的窗口,那就需要設(shè)一個相應(yīng)的域值。當(dāng)域值超過一定的量,就說明物品確實存在于此小窗口。把小窗口全部連接起來,就會得到大一點的圖片。同樣再通過CNN做一次判斷,判斷這是不是對概率有所提高,或者降低。這樣就可以通過每個小圖拼湊起來個完整的物品。

這里面還有很多復(fù)雜的地方。比如說,YOLO有可能會發(fā)現(xiàn)其他框也可以體現(xiàn)一個車,可以有很多的連接各種小的grid也可以得到一個比較完整的物體,這個時候就要判斷哪一個框最能代表這個物品。

總而言之,YOLO再加上目前最火的算法GPU可以很快的把動態(tài)的圖片提取出包含這個物品的小框,進而確定是什么樣的物品。是人、還是商品、還是人和商品。這樣的話,可以很快地確定這張圖里面的顧客有沒有拿東西。2014年Amazon就已經(jīng)申請了相關(guān)的專利。

 

 

從圖中可以看到:每一個物品都是有編號的;攝像頭還有網(wǎng)絡(luò)有相關(guān)的代碼;錄像機、攝像頭全部都可以實時的處理。顧客每走到不同的貨架旁邊,從相應(yīng)的貨架取下一個物品,之后系統(tǒng)就知道這個物品是否還存在,它的重量會變化,它相應(yīng)的圖像也會有變動。

每個物品都有自己對應(yīng)的編碼,以此幫助系統(tǒng)來判斷該物品是不是已經(jīng)被拿走。這里可以判斷商品的數(shù)據(jù)源有很多,首先從卷積神經(jīng)網(wǎng)絡(luò)得出來自圖片的判定,還有來自重量和壓力變化的判定,同時還可以結(jié)合用戶過去的交易記錄來判斷是不是有可能的交易行為。

這里也可以用到DeepLearning(深度學(xué)習(xí)),作為input可以判斷出用戶是否有購買能力,從而做出相應(yīng)的判斷。

下一個實例是SmartSpeaker。

 

 

從2014年開始,Amazon就投入了大量的資金研發(fā)Alexa這個智能音箱的產(chǎn)品。緊跟著大家發(fā)現(xiàn)這個市場特別的好,Google也推出了Google assistant,微軟也是在2016年推出了音箱Cortana。到去年為止,亞馬遜又提出升級版本,推出了Show還有Look這種帶攝像頭的產(chǎn)品。蘋果也推出了自家的智能音箱Homepod,今年會推出它的更新版,和Siri聯(lián)系在一起。三星也是相應(yīng)的推出Bixby,廣告上也經(jīng)常在提到。

智能音箱是非常火爆的產(chǎn)品,各大電商技術(shù)巨頭都推出相應(yīng)產(chǎn)品,幫助大家在網(wǎng)上下單,買賣東西。Amazon Echo這個最先驅(qū)的產(chǎn)品,或者說從Echo開始智能音箱才打開了市場。

 

 

Echo現(xiàn)在的功能已經(jīng)非常的強大了,圖像化的它可以連上手機的各種APP,聽音樂、聽電臺、聽新聞、看電視、叫車,放在家里可以用來看Amazon fireTV,同時智能家電像溫度開關(guān),還有家里的電燈開關(guān),都可以通過智能音箱去控制。

Echo主要的技術(shù)背景就是語音識別和語義分析。語音識別就是通過不管是英語還是中文,還是其他阿拉伯語、日本語都可以讓智能音箱能了解到大家想要做什么樣的事情。

 

 

語音識別的技術(shù)近幾年也是發(fā)展迅猛。最初的語音識別就是把每個語音波段提取相應(yīng)的音素(Phoneme)并提取特征。就像拼音的元音、輔音,一些比較有代表性的發(fā)音都是由音素組成。把這些元素提取出來,拼湊成相應(yīng)的字,或者詞組。這是剛開始的語音識別的比較工程化的技術(shù),現(xiàn)在已經(jīng)發(fā)展到用RNN(遞歸神經(jīng)網(wǎng)絡(luò))。

遞歸神經(jīng)網(wǎng)絡(luò)不同于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò),它是有遞歸性的。意思就是說每一個神經(jīng)元(見上圖)是互相連接的。上一層的a(激活函數(shù))處理完的輸出可以直接輸出到下一個函數(shù),這樣不斷的迭代。同時每一個相應(yīng)的輸入,不同的單詞、詞組都會分別輸入到每個神經(jīng)元里面,但是這些神經(jīng)元又是跟之前的神經(jīng)元相連。更復(fù)雜一點的網(wǎng)絡(luò)可以從正方向相連,也可以從反方向互相聯(lián)系。

最后訓(xùn)練成功的這個網(wǎng)絡(luò)里每個神經(jīng)元都會輸出Y1Y2這樣的值。如果需要提取名字的話像“Teddy bear”輸出可以這樣表示:0011000。更復(fù)雜的情況里Y可以變成一整個向量性的輸出。在一個詞庫里面,比如“Teddy”對應(yīng)的值為1,詞庫里面其他不相關(guān)的詞就會判斷為0。

當(dāng)遞歸神經(jīng)網(wǎng)絡(luò)判斷出來某個詞在相對應(yīng)的階段的語音接近于對應(yīng)的單詞,它直接跳過音素這種比較傳統(tǒng)的步驟,直接通過整個語音的長度和廣度判斷出這段聲音代表的什么意思。這個就是語音識別的大概的工作原理。

有了語音識別,識別出的相應(yīng)的文字就可以做NLP(自然語言分析),也是語義分析。

 

 

語義分析也是很熱門的學(xué)科,可以做各種各樣的事情,比如說最常見的:

詞頻統(tǒng)計:通過公式計算詞頻在某個文件、某個文檔里面出現(xiàn)多少次,或是通過統(tǒng)計某篇文章或者整個文庫里邊該詞出現(xiàn)的頻率做一個層級,就可以算出它正交化的詞頻統(tǒng)計。有了這個相關(guān)的數(shù)據(jù)可以作為數(shù)據(jù)輸入。

NER(Name Entity Recognition):是專門做名字、名詞相關(guān)的物品的一個識別。

POS(Part Of Speech,詞性解析):像中文的主謂賓是主語,在英語里邊就是形容詞、名詞、代名詞。

N-Gram(組合詞頻):比如Cat就是一個單詞;Running Cat,就是一個詞組,它是有兩個單詞進行,就是2-gram,N-gram就是把這些高頻組合的詞去挖掘出來。

Word embedding:把各個詞,按照它們的類別進行分類。比如Man、Woman可以按照性別等等進行分類,可以把它作為一個相關(guān)性的向量展開,這就是單詞嵌入,每個詞就賦予了更深的意義。

有了以上的這些就可以做進一步的分析。比如情緒分析,喜歡還是不喜歡,正面的色彩還是負面的色彩。像一些打分系統(tǒng),就是用情緒分析來做。

也可以使用Word Embedding繼續(xù)做GloVe/Word2Vec。把詞展開到對應(yīng)的向量空間,從而可以判斷它在整個句子的成分;或者通過聯(lián)系上下文來判斷該詞在一段內(nèi)容里表示的具體意思,或者對將要出現(xiàn)的下文做判斷預(yù)測。

同樣還可以開發(fā)聊天機器人,有了這些NLP的手段可以去跟真人聊天,或者是解決一些簡單的與真人互動的問題。比如開燈關(guān)燈、開電視,從語音分析里面提取想要的重點,達到想要完成的愿望。

最后一個實例是Netflix Artwork。這也是很有意思的一個實例。Netflix用上了數(shù)據(jù)科學(xué)和AI技術(shù)。

 

 

對不同的人群來說,這些海報應(yīng)該怎么樣宣傳?這里就可以把影片的各個情節(jié)都提取相應(yīng)的插圖作為海報,喜歡恐怖片的朋友可能會更愛看點帶血腥的,或者帶火焰的;喜歡小朋友的觀眾可能看到有很多小孩的海報;還有的人喜歡某一個明星,那么他個人的海報對于作為粉絲的你來說更容易感興趣。因此這里需要一個有效的推薦引擎來給不同的用戶推薦,來讓用戶看了這個宣傳海報以后更有可能點擊播放。

傳統(tǒng)的方法就是首先收集數(shù)據(jù),建好模,做好各種A/B testing,然后把這個Model正式出品,執(zhí)行在前端。這個方法會耗時很久,短暫來說可能也要花上幾星期,長一點可能是數(shù)月。在這段時間內(nèi),可能用戶的喜好就會發(fā)生很大的變化?赡茉谶@個模型推出以后跟之前預(yù)測的用戶在這個時間點的品位又不一樣,模型反而不清晰,產(chǎn)生很大的分歧。

Netflix最新的算法是一種強化學(xué)習(xí)的手段叫Reinforcement Learning(RL)。它的主要特點就是可以快速的迭代,持續(xù)的優(yōu)化。

 

 

它的核心思想簡單來說是就是多臂帶寬(Multi-Arm Bandit)的算法。在RL里面定義一個state,通過rewardfunction Q,就會得出reword是多少。像這個章魚一樣,每執(zhí)行不同的步驟就會有不同的效果,每一臺都像賭博機一樣,啟動了賭博機A和賭博機C,可能會輸或者都會贏,value都不一樣。

上圖中的公式在這里就定義了:功效應(yīng)該等于reward加上γ乘以未來的功效。假如γ是0,就不考慮未來期望值,上一次得到的reward是多少,就一直按照這個方式去進行,不會去考慮其他的可能性。

現(xiàn)在看來要達到最好的辦法,Netflix采用了一個叫做Contextual Bandit(環(huán)境帶寬算法)。

 

 

環(huán)境帶寬算法實際上是來定義用戶是一種環(huán)境變量,因為每一個用戶都有不同的背景和喜好,Netflix就把剛才的公式復(fù)雜化,加入了learning rate。意思就是說顧客未來的這個Q’,需要通過建模來達到通預(yù)測的功效。

加入了learning rate之后,α如果等于1,就可以去掉兩邊,換成多臂帶寬算法;如果模型不需要太考慮未來,那就用剛才簡單優(yōu)化算法,按照每一次的結(jié)果,來選每次得到最高效用的那個模型;如果想讓RL模型去學(xué)習(xí)更多、探索更多未來的未知的情況,就假設(shè)α不是1,這個時候Q’ 的作用就能夠體現(xiàn)出來。

Q’用一個類似于深度神經(jīng)網(wǎng)絡(luò)這樣的模型來做預(yù)測,例如把數(shù)以百萬的客戶的瀏覽記錄,個人背景,還有年齡性別這些相應(yīng)的信息作為輸入,用這樣的方法對這些信息做一個深度學(xué)習(xí)的Training

另外一個簡單的例子是股市交易,輸入信息是budget和shares,加上交易的記錄,可以做出一個深度學(xué)習(xí)的網(wǎng)絡(luò)。它可以做出需要買還是賣還是hold的決策。最后可以用Q’作為未來回報的預(yù)測。有了整套系統(tǒng)之后,只要知道了近期的return,就可以預(yù)測的未來的Return。當(dāng)然,這個Q’太初級,可能要在不斷的迭代之后才可以正式地被使用。通過比剛才提到的單一的建?紤]到更多的變量,它會更加快速的迭代。

電商行業(yè)的新寵,就是深度神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)以及遞歸神經(jīng)網(wǎng)絡(luò),以及強化學(xué)習(xí)。在未來的電商行業(yè)里,通過積極的發(fā)展,它們運用的方向是非常廣闊的。像行為預(yù)測,智能圖像、還有語音識別、個性化推薦,在電商各個環(huán)節(jié)都是必不可少的。未來應(yīng)該會很快的看到這些AI的技術(shù)運用于顧客的體驗和買賣活動當(dāng)中。

標(biāo)簽: Google 代碼 電商 電商行業(yè) 網(wǎng)絡(luò)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:2019 年即將問世的 10 項機器學(xué)習(xí)應(yīng)用盤點

下一篇:在小公司如何做一名成功的數(shù)據(jù)科學(xué)家?