中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

從學(xué)術(shù)角度論Uber的人工智能預(yù)測(cè)醉酒專(zhuān)利

2018-07-10    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線(xiàn)!快速搭建集群,上萬(wàn)Linux鏡像隨意使用
作者:傅志華

近日公布的美國(guó)專(zhuān)利申請(qǐng)記錄顯示,Uber(優(yōu)步,類(lèi)似滴滴打車(chē))申請(qǐng)了一個(gè)非常有意思的專(zhuān)利,即用人工智能來(lái)識(shí)別醉酒乘客。Uber 申請(qǐng)的這項(xiàng)專(zhuān)利名為“Predicting User State Using Machine Learning”,即“以機(jī)器學(xué)習(xí)預(yù)測(cè)用戶(hù)狀態(tài)”,由 Uber 的信任和安全團(tuán)隊(duì)提交。在專(zhuān)利描述中,Uber稱(chēng)他們將研發(fā)一個(gè)協(xié)調(diào)系統(tǒng),該系統(tǒng)使用關(guān)于過(guò)去在Uber上的行程和行為數(shù)據(jù)來(lái)訓(xùn)練計(jì)算機(jī)預(yù)測(cè)提交行程請(qǐng)求的用戶(hù)的狀態(tài)(原文提到:The system uses the data about past trips to train a computer model to predict a user state of a user submitting a trip request)。

簡(jiǎn)單來(lái)說(shuō),Uber會(huì)根據(jù)用戶(hù)使用 Uber App 的方式來(lái)識(shí)別異常行為,預(yù)測(cè)用戶(hù)是否處于醉酒(不清醒)狀態(tài)。比如,假設(shè)周末的凌晨 1 點(diǎn),你站在酒吧街區(qū)域打車(chē),輸入目的地時(shí)緩慢且多次出錯(cuò),跟平常工作日的雷厲風(fēng)行完全不一樣,那么系統(tǒng)將可以判定你處于不清醒狀態(tài)。

 

當(dāng)Uber的這套系統(tǒng)識(shí)別出“不清醒狀態(tài)”,這個(gè)系統(tǒng)將因此調(diào)整 Uber 所提供的服務(wù)。比如為這些用戶(hù)安排經(jīng)過(guò)培訓(xùn)、有相關(guān)經(jīng)驗(yàn)的司機(jī),并提前告知司機(jī)乘客的狀態(tài)。另外,還可以將上下車(chē)地點(diǎn)改在光線(xiàn)較足的地方,并關(guān)閉拼車(chē)功能保證安全等。而Uber在專(zhuān)利描述中稱(chēng),希望通過(guò)這個(gè)系統(tǒng),可以減少人身安全或嘴角、沖突等讓人不快的乘車(chē)體驗(yàn)。但這個(gè)模型如果使用不當(dāng),也會(huì)產(chǎn)生負(fù)面的影響,其中一個(gè)擔(dān)心是人工智能可能會(huì)被部分居心叵測(cè)的司機(jī)所利用。

數(shù)據(jù)顯示,過(guò)去 4 年里在美國(guó)至少有 103 名 Uber 司機(jī)被指控對(duì)乘客進(jìn)行性侵犯,其中不少受害者就是在醉酒情況下乘車(chē)的。目前,這項(xiàng)專(zhuān)利還未投入使用。

本文不打算從倫理道德來(lái)分析這個(gè)專(zhuān)利的影響,畢竟這個(gè)專(zhuān)利還沒(méi)有正式投入使用,本文只是從學(xué)術(shù)角度來(lái)研究模型實(shí)現(xiàn)的原理。下圖是整個(gè)模型的架構(gòu),包括所需求的數(shù)據(jù)、算法和結(jié)果。

 

 

模型整體的架構(gòu)如下:當(dāng)用戶(hù)輸入信息將乘坐請(qǐng)求(Request data,圖中1)生成到用戶(hù)設(shè)備(即手機(jī))中時(shí),系統(tǒng)同時(shí)收集關(guān)于用戶(hù)設(shè)備上的用戶(hù)活動(dòng)的信息(Current User Activity Data,圖中2),系統(tǒng)同時(shí)同步已經(jīng)自動(dòng)生成好的用戶(hù)畫(huà)像數(shù)據(jù)(User Profile,圖中3);A(chǔ)數(shù)據(jù)準(zhǔn)好了以后,并進(jìn)入特征工程模塊,即系統(tǒng)會(huì)基于數(shù)據(jù)用戶(hù)畫(huà)像數(shù)據(jù)(圖中3)和當(dāng)前用戶(hù)活動(dòng)數(shù)據(jù)(圖中2)構(gòu)建用戶(hù)特征數(shù)據(jù)(圖中4),同時(shí)實(shí)時(shí)收集行程特征數(shù)據(jù)(Trip Features,圖中5)。用戶(hù)特征數(shù)據(jù)和行程特征數(shù)據(jù)是特征工程中重要的兩類(lèi)模型輸入(Input)。

我們重點(diǎn)分析重要的數(shù)據(jù)源:

1、“用戶(hù)請(qǐng)求數(shù)據(jù)”和“用戶(hù)當(dāng)前活動(dòng)數(shù)據(jù)”。“用戶(hù)請(qǐng)求數(shù)據(jù)”是指用戶(hù)在uber的個(gè)中使用請(qǐng)求數(shù)據(jù),這些數(shù)據(jù)生成“用戶(hù)當(dāng)前活動(dòng)數(shù)據(jù)”。“用戶(hù)當(dāng)前活動(dòng)數(shù)據(jù)”指用戶(hù)對(duì)手機(jī)用戶(hù)設(shè)備的輸入,以及用戶(hù)設(shè)備本身的移動(dòng)行為。用戶(hù)當(dāng)前活動(dòng)數(shù)據(jù)可以包括設(shè)備處理特性、接口交互特性和文本輸入特性數(shù)據(jù)。這些數(shù)據(jù)可能會(huì)通過(guò)手機(jī)中的運(yùn)動(dòng)傳感器、設(shè)備角度傳感器、GPS和內(nèi)置在屏幕中的觸摸傳感器等方式來(lái)收集。如設(shè)備處理特性數(shù)據(jù),包括用戶(hù)在請(qǐng)求提交時(shí)或接近該請(qǐng)求時(shí)的速度、用戶(hù)在請(qǐng)求時(shí)保持用戶(hù)設(shè)備的角度、設(shè)備移動(dòng)速度。文本輸入特性數(shù)據(jù)如用戶(hù)輸入文本的準(zhǔn)確性、選擇搜索結(jié)果之前被刪除的字符數(shù)等行為數(shù)據(jù)。接口交互特性數(shù)據(jù)如在生成uber行程單請(qǐng)求時(shí),用戶(hù)可以與多個(gè)用戶(hù)界面交互,例如設(shè)置行程的起始點(diǎn)位置、選擇行程的設(shè)置、輸入搜索字符串以確定行程的目的地等等;系統(tǒng)會(huì)采集用戶(hù)與這些接口交互的速度(例如,在特定輸入屏幕上的平均時(shí)間、交互之間的時(shí)間),以及用戶(hù)與搜索查詢(xún)接口的交互速度。

2、“用戶(hù)特征數(shù)據(jù)”,通過(guò)統(tǒng)計(jì)和分析“用戶(hù)畫(huà)像數(shù)據(jù)”和“當(dāng)前用戶(hù)活動(dòng)數(shù)據(jù)”而得來(lái)。“用戶(hù)特征數(shù)據(jù)”是特征工程的一個(gè)重要部分,目標(biāo)是構(gòu)建更有預(yù)測(cè)能力的變量。比如文本輸入速度以及文本輸入速度的變化率、用戶(hù)平均步行速度以及用戶(hù)平均步行速度的變化率、點(diǎn)擊行為速度和點(diǎn)擊行為速度的變化率等等。例如,用戶(hù)平均步行速度是指在過(guò)去的一段時(shí)間內(nèi)步行速度的平均值;而用戶(hù)平均步行速度的變化率,是指用戶(hù)在當(dāng)前一段時(shí)間內(nèi)的速度與用戶(hù)在過(guò)去一段時(shí)間內(nèi)的平均步行速度的比值。

3、“行程特征數(shù)據(jù)”。“行程特征數(shù)據(jù)”是從用戶(hù)請(qǐng)求數(shù)據(jù)提取出行特征的數(shù)據(jù),例如與請(qǐng)求的位置、地理和時(shí)間特征。行程特征可以包括用戶(hù)位置、天氣狀況、一天的時(shí)間和請(qǐng)求提交是在星期幾。某些行程特征由系統(tǒng)確定,而不是由請(qǐng)求數(shù)據(jù)確定,例如時(shí)間和星期幾、天氣條件等。

“用戶(hù)特征數(shù)據(jù)”和“行程特征數(shù)據(jù)”都是特征工程的兩類(lèi)重要數(shù)據(jù)。特征工程中,構(gòu)建這兩類(lèi)數(shù)據(jù)目標(biāo)是構(gòu)建更有預(yù)測(cè)能力的變量。我們利用這兩類(lèi)數(shù)據(jù)的歷史數(shù)據(jù),通過(guò)監(jiān)督機(jī)器學(xué)習(xí)模型來(lái)對(duì)數(shù)據(jù)訓(xùn)練建模。所謂監(jiān)管學(xué)習(xí)就是給定一組學(xué)習(xí)樣本,每個(gè)樣本都有一組屬性和一個(gè)類(lèi)別,這些類(lèi)別是事先確定的,那么通過(guò)學(xué)習(xí)得到一個(gè)分類(lèi)器,這個(gè)分類(lèi)器能夠?qū)π鲁霈F(xiàn)的對(duì)象給出正確的分類(lèi),這樣的機(jī)器學(xué)習(xí)就被稱(chēng)之為監(jiān)督學(xué)習(xí)。

Uber的專(zhuān)利中提到核心算法主要是分類(lèi)算法如決策樹(shù)、支持向量機(jī)或神經(jīng)網(wǎng)絡(luò)。用戶(hù)狀態(tài)預(yù)測(cè)模型一旦建立了并通過(guò)相關(guān)的模型檢驗(yàn)后,即可以對(duì)實(shí)時(shí)的用戶(hù)數(shù)據(jù)進(jìn)行分析,并利用模型預(yù)測(cè)用戶(hù)的狀態(tài)是否為“清醒”狀態(tài)。

由于篇幅關(guān)系,本文對(duì)Uber專(zhuān)利提到的三個(gè)算法進(jìn)行原理性的介紹:

1、決策樹(shù)(decision tree)是一類(lèi)常見(jiàn)的機(jī)器學(xué)習(xí)方法,目的是為了產(chǎn)生一棵泛化能力強(qiáng),即處理未見(jiàn)示例能力強(qiáng)的決策樹(shù)。決策樹(shù)學(xué)習(xí)是采用自頂向下的遞歸方法,其基本思想是以信息熵為度量構(gòu)造一棵熵值下降最快的樹(shù);

2、支持向量機(jī)。支持向量機(jī)(Support Vector Machine,SVM)是一個(gè)常見(jiàn)的分類(lèi)器,核心思路是通過(guò)構(gòu)造分割面將數(shù)據(jù)進(jìn)行分離,一個(gè)支持向量機(jī)構(gòu)造一個(gè)超平面,或在高或無(wú)限維空間,其可以用于分類(lèi);

3、神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)的作用本質(zhì)上也是一個(gè)分類(lèi)器,人工神經(jīng)網(wǎng)絡(luò)是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。人工神經(jīng)網(wǎng)絡(luò)由大量的節(jié)點(diǎn)(或稱(chēng)神經(jīng)元)之間相互聯(lián)接構(gòu)成,每個(gè)節(jié)點(diǎn)代表一種特定的輸出函數(shù),稱(chēng)為激勵(lì)函數(shù)(activation function)。每?jī)蓚(gè)節(jié)點(diǎn)間的連接都代表一個(gè)對(duì)于通過(guò)該連接信號(hào)的加權(quán)值,稱(chēng)之為權(quán)重,這相當(dāng)于人工神經(jīng)網(wǎng)絡(luò)的記憶。目前神經(jīng)網(wǎng)絡(luò)算法已經(jīng)有幾十種,最近流行的深度學(xué)習(xí)也屬于神經(jīng)網(wǎng)絡(luò)的發(fā)展方向。

我們用一個(gè)簡(jiǎn)單的示例來(lái)更直觀(guān)的闡述上述過(guò)程。在uber的專(zhuān)利文獻(xiàn)中提到一個(gè)例子,見(jiàn)以下表“用戶(hù)狀態(tài)預(yù)測(cè)模型數(shù)據(jù)示例”。

 

 

表格中,每一行代表一條用戶(hù)記錄數(shù)據(jù)。第一列是加密后的用戶(hù)ID,用來(lái)唯一區(qū)分每個(gè)用戶(hù)。第二列至第六列是用戶(hù)特征數(shù)據(jù)(User Features),包括用戶(hù)文本的輸入精度、用戶(hù)數(shù)據(jù)輸入速度、按鈕點(diǎn)擊行為、設(shè)備的角度、步行速度。第七至第八列是“行程特征數(shù)據(jù)(Trip Features)”,包括位置、時(shí)間和星期。值得大家注意的是,用戶(hù)特征數(shù)據(jù)和行程特征數(shù)據(jù)只是列了部分變量,并沒(méi)有列全,只是為了舉例方便。最后一列“異常狀態(tài)識(shí)別”是通過(guò)模型預(yù)測(cè)的用戶(hù)異常狀態(tài),1代表異常,0代表正常。正如上文提到,用戶(hù)的“異常狀態(tài)預(yù)識(shí)別”是通過(guò)基于用戶(hù)特征數(shù)據(jù)(User Features)和行程特征數(shù)據(jù)(Trip Features)進(jìn)行訓(xùn)練,通過(guò)有監(jiān)督學(xué)習(xí)的機(jī)器學(xué)習(xí)算法(上文提到的三種算法),建立“用戶(hù)狀態(tài)識(shí)別預(yù)測(cè)模型”計(jì)算得出。

從預(yù)測(cè)結(jié)果我們可以看到,第一列用戶(hù)(用戶(hù)ID為28HQ5)為預(yù)測(cè)為異常用戶(hù),即醉酒的可能性很大。第二列用戶(hù)(用戶(hù)ID為B24L9)為預(yù)測(cè)正常用戶(hù)。這兩位用戶(hù)的差異在于數(shù)據(jù)輸入精準(zhǔn)度(異常用戶(hù)精準(zhǔn)度更低)、按鈕點(diǎn)擊次數(shù)(異常用戶(hù)點(diǎn)擊次數(shù)更多)、設(shè)備角度(異常用戶(hù)角度更傾斜)、位置的差異、時(shí)間(異常用戶(hù)在凌晨?jī)牲c(diǎn)多打車(chē))、星期的差異(異常用戶(hù)在周末)。從典型的用戶(hù)分析也能看到正常和異常用戶(hù)的用戶(hù)特征數(shù)據(jù)和行程特征數(shù)據(jù)有顯著的差異。

Uber通過(guò)其APP收集到的數(shù)據(jù),利用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)的是否處于醉酒狀態(tài)的預(yù)測(cè),在其他領(lǐng)域也有非常多的應(yīng)用場(chǎng)景,包括保險(xiǎn)、交通安全、金融、安防等領(lǐng)域。在保險(xiǎn)領(lǐng)域,如果我們了解到某個(gè)用戶(hù)經(jīng)常酗酒,那么該用戶(hù)很可能出險(xiǎn)的概率就高,對(duì)于保險(xiǎn)公司來(lái)說(shuō),并不是最優(yōu)質(zhì)的客戶(hù);在交通安全領(lǐng)域,暢想一下,相關(guān)的交通管理機(jī)構(gòu)聯(lián)合大型互聯(lián)網(wǎng)企業(yè)做用戶(hù)不清醒狀態(tài)的預(yù)測(cè),如果某用戶(hù)醉酒的可能性很大,那么可以通過(guò)互聯(lián)網(wǎng)應(yīng)用來(lái)提醒該用戶(hù)酒后不要駕駛;在金融領(lǐng)域,以小額貸款為例,如果發(fā)現(xiàn)某個(gè)用戶(hù)老是醉酒,其征信得分應(yīng)該有所降低,貸款審核也應(yīng)該更加慎重。

參考專(zhuān)利文獻(xiàn):

Predicting User State Using MachineLearning,Poeppel; Scott; (Pittsburgh, PA) ; Letwin; Nicholas G.; (Pittsburgh,PA) ; Kelly; Sean J.; (Pittsburgh, PA), Uber Technologies, Inc

專(zhuān)利文獻(xiàn)鏈接:

http://appft.uspto.gov/netacgi/nph-Parser Sect1=PTO2&Sect2=HITOFF&u=%2Fnetahtml%2FPTO%2Fsearch-adv.html&r=3&p=1&f=G&l=50&d=PG01&S1=uber.AANM.&OS=aanm/uber&RS=AANM/uber

標(biāo)簽: 安全 互聯(lián)網(wǎng) 互聯(lián)網(wǎng)企業(yè) 金融 搜索 網(wǎng)絡(luò)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀(guān)點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:帶你用深度學(xué)習(xí)虛擬機(jī)進(jìn)行文本遷移學(xué)習(xí)(附代碼)

下一篇:中國(guó)大數(shù)據(jù),不只“數(shù)據(jù)大” 產(chǎn)業(yè)規(guī)模近5000億元