中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

最好的數(shù)據(jù)科學家,就是把自己給“干掉”

2018-06-28    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用
在不到兩個月前,百度旗下金融服務事業(yè)群“度小滿”,成功融資 19 億美元,成為金融業(yè)務領域的新“獨角獸”企業(yè)。這一成績被李彥宏評價為:“百度AI 戰(zhàn)略的里程碑事件”。

作為成立僅兩年多的部門,百度金融獨角獸業(yè)績的背后,被普遍認為是源于其“ AI 平臺”戰(zhàn)略的支持。丁磊是百度金融的前首席數(shù)據(jù)科學家,在職期間,他主導了多項基于“AI平臺”的金融科技項目,見證了百度金融迅速崛起的過程。

對于已經(jīng)在AI行業(yè)中浸染多年的丁磊來說,這已經(jīng)不是他第一次利用“AI平臺”,實現(xiàn)商業(yè)業(yè)績的規(guī)模化增長了。在他看來,將 AI 等數(shù)據(jù)科學的方法,與實際場景相融合,帶動業(yè)績的翻升,早已不是新鮮事。在 2013 年,他就已經(jīng)在美國領導 PayPal 團隊,成功建設了 AI 平臺,帶動了 PayPal 的業(yè)務增長。

不追熱點,不講泡沫,用他自己的話說:“我對于數(shù)據(jù)科學的信心來自于真正的賦能”。

那么數(shù)據(jù)科學究竟能帶來怎樣的賦能呢?

成倍的客戶增長

丁磊是 PayPal 2012 年成立數(shù)據(jù)科學部門時的創(chuàng)始數(shù)據(jù)科學家之一。

彼時,是數(shù)據(jù)科學概念興起的前夜:移動互聯(lián)網(wǎng)的繁榮讓B端積累起了大量的數(shù)據(jù),計算機芯片的進步和Hadoop等大數(shù)據(jù)框架讓處理海量數(shù)據(jù)變得現(xiàn)實可行;與此同時,在學界已經(jīng)積累多年的機器學習等算法模型,也終于開始在業(yè)界有了用武之地;谷歌等硅谷公司開始大量招募數(shù)據(jù)科學人才......眾多跡象都表明,這是一個數(shù)據(jù)科學即將在商業(yè)領域迸發(fā)的時刻。

在這樣的背景下,PayPal 等硅谷的科技公司紛紛開始成立自己的數(shù)據(jù)科學部門,希望將數(shù)據(jù)科學的相關技術應用到實際業(yè)務中。

然而丁磊他們起初的實驗并不順利。折騰了一年,PayPal 最開始的數(shù)據(jù)科學團隊,并沒有找到自己在商業(yè)世界中的位置。一年后,領隊黯然離職。

“當時團隊遇到的最大問題,是數(shù)據(jù)科學在公司的落地”,丁磊回憶道,“就是沒有做下去。”

雖然第一年出現(xiàn)了一些波折,但 PayPal 在數(shù)據(jù)科學上的戰(zhàn)略方向并沒有改變。丁磊這時候“臨危受命”,重新組建了新的團隊——PayPal 消費者數(shù)據(jù)科學部。

 

 

(圖片說明:PayPal 是全球最遍布范圍最廣的第三方支付平臺之一,目前市值超過千億美元;圖片來源:Flicker,Kimberly Blessing)

在他看來,之前落地失敗的原因主要有兩個:一方面是商業(yè)與數(shù)據(jù)科學本身的割裂,“也就是所數(shù)據(jù)科學帶來的收益不能立刻就在商業(yè)中體現(xiàn)出來”;另一方面是數(shù)據(jù)科學的研究沒有產(chǎn)品化,單個項目的成本過高。

“如果一個合作伙伴過來,需要一個產(chǎn)品營銷方案,你從提數(shù)據(jù)、建模、驗證、迭代......傳統(tǒng)的數(shù)據(jù)科學流程可能需要至少一個月的時間”,丁磊說道。單個項目的復雜流程限制了數(shù)據(jù)科學業(yè)務的規(guī);,高昂的人力和時間成本也在制約著這支團隊的發(fā)展。

丁磊想到的解決方法是,建立公司內(nèi)部的“數(shù)據(jù)科學平臺”,讓數(shù)據(jù)科學能夠工程化、產(chǎn)品化、規(guī)模化地服務現(xiàn)代商業(yè)項目。

“數(shù)據(jù)科學平臺”是一個統(tǒng)稱,它相當于一個大框架,囊括了海量數(shù)據(jù)分析、機器學習、深度學習、數(shù)據(jù)可視化和智能決策等諸多技術領域。在設計這個平臺的時候,丁磊的最終目的是希望它能實現(xiàn)對商業(yè)項目的部分自動化決策,所以也稱其為“AI(人工智能)平臺”。

幸運的是,丁磊的想法成功了。

PayPal 用了兩年的時間成功建立了自己的 AI 平臺。這個平臺主要有基于 AI 的動機引擎、推薦引擎、以及優(yōu)化客戶生命周期的 Next Best Action 引擎構(gòu)成,而這幾個引擎均部署在基于 Hadoop 和 Spark 的大數(shù)據(jù)平臺之上,能夠跟海量的底層數(shù)據(jù)銜接,面對需求能夠自動地提出解決方案。

憑借這個項目,丁磊成功實現(xiàn)了AI的工程化商業(yè)落地。到現(xiàn)在,這都是一項非常領先的 AI 業(yè)務創(chuàng)新案例。這個平臺為 PayPal 帶來了成倍的客戶增長,并且至今仍在使用。

之后,PayPal 的業(yè)績也出現(xiàn)了飛速的提升。“營銷活動平均響應率提升了 2-3 倍,某些營銷活動的點擊率和兌現(xiàn)率超過5倍,總體ROI也得到大幅提升”,丁磊說道。

2014 年底 PayPal 實現(xiàn)了19.4億美元的利潤,比 2012 年底提升了近 30%。到 2015 年,利潤甚至超過了母公司 eBay。隨后 PayPal 從 eBay 剝離單獨上市,至今市值已經(jīng)增長了 1.25 倍,超過千億美元。

丁磊的這套 AI 平臺系統(tǒng)也并不是什么“新事物”,他與 AI 的緣分,其實早在十幾年前就開始了。

從0到1的數(shù)據(jù)科學家

“我在高中的時候就想做 AI 了。”

雖然聽起來有些不可思議,但當丁磊還是一個高中生時,他就非常清楚自己未來的發(fā)展方向了。丁磊說,這是源于自己對機器人的喜愛。

但是當時國內(nèi)高校并沒有開設“人工智能”的相關專業(yè),“那我就選擇一個離AI最近的專業(yè),當時就是計算機了。”高中畢業(yè)后,丁磊被保送進入浙江大學計算機學院。一入學他就主動尋找研究 AI 方向的導師,目的非常明確,就是要學 AI。

在這個當年非常小眾的專業(yè)方向里,丁磊卻學得不亦樂乎。他跟隨導師研究自然語言處理中的文本分類問題,在本科階段就發(fā)表了一篇國內(nèi)核心期刊的論文。

 

 

(圖片說明:丁磊應邀在MIT技術大會討論人工智能應用;圖片來源:丁磊)

本科畢業(yè)后,他來到美國繼續(xù)深造博士學位,研究方向為機器學習和計算機視覺。如果從AI發(fā)展的曲線來看,在丁磊求學的很長一段時間里,AI 都處于“第二春”破滅后的低谷期,發(fā)paper難、商業(yè)應用難、普遍不看好等等都是常見現(xiàn)象。但在整個學生時代,丁磊的求學都非常積極主動,在自己認定了AI的方向后,他從來就沒有過任何猶豫。

這些年在他身邊,門戶網(wǎng)站、社交網(wǎng)絡、移動互聯(lián)網(wǎng)等科技熱浪一浪高過一浪,但是他始終沉浸在自己的AI世界里。“我喜歡把看過的論文都疊放在一起,等到博士畢業(yè)的時候,疊放的論文有差不多一人高吧。”丁磊說道。直到 2006 年,隨著訓練高層神經(jīng)網(wǎng)絡算法的出現(xiàn),以及計算技術的持續(xù)進步,AI的研究進入第三春,拉開了這一輪人工智能高潮的序幕。

丁磊在美國讀博的時候,曾在 IBM Watson 有過一段工作經(jīng)歷,那是他第一次與 AI 進行商業(yè)化接觸。

“那是 2009 年,我有機會去 IBM 參與其智慧零售項目的計算機視覺部分”,丁磊回憶道。當時IBM 已經(jīng)將這個項目成功落地在了 Tesco 等超市,一定程度上實現(xiàn)了無人零售的職能,這比阿里巴巴等中國的智慧零售項目要早了將近十年。

作為 AI 商業(yè)化概念的先行者,IBM 的 Watson 產(chǎn)品讓丁磊積累了很多讓AI與產(chǎn)業(yè)相結(jié)合的寶貴經(jīng)驗,還申請了四項研究專利。這也讓他逐漸萌生了從學界轉(zhuǎn)入業(yè)界的想法。

2011 年丁磊來到紐約后,加入了一家知名風投旗下的創(chuàng)業(yè)公司擔任數(shù)據(jù)科學家,正式轉(zhuǎn)入產(chǎn)業(yè)界。他的第一份工作是利用 AI 技術為 Expedia (全球最大的旅游類電商網(wǎng)站)構(gòu)建用戶行為預測引擎,優(yōu)化用戶體驗的同時,大幅提升廣告投放效果。

“因為有很多用戶是網(wǎng)站訪客,沒有注冊信息,很難追蹤他們的行為,這讓我們模型的預測過程難度很大。”不過丁磊他們最后設計的模型可以通過理解細微的行為信號,判斷訪客的真正意圖,上線后效果非常好,大幅提升了公司的營收。這也讓丁磊堅定了自己對AI商業(yè)化的判斷。后來他加入了 PayPal,希望在更大的平臺上一展身手,于是就有了前文那套“AI平臺”。

與商業(yè)的“水乳交融”

丁磊認為,數(shù)據(jù)科學分為三個階段:1.0 的時候是簡單的事后數(shù)據(jù)分析,例如報表等;2.0 則是利用更為完備的查詢工具和統(tǒng)計方法,輔助業(yè)務決策;到 3.0 的時候,就是通過 AI、大數(shù)據(jù)等方法進行預測分析,進而直接做出決策,也就是現(xiàn)在的 AI 時代。

AI的商業(yè)化應用無非分為兩個方面:感知和決策。在學院派階段,丁磊的重點集中在感知層面,包括計算機視覺、聽覺、自然語言處理等,這些考驗更多的是他的科學研究能力。到了商業(yè)環(huán)境中,效率至上的文化要求數(shù)據(jù)科學家有更強的業(yè)務理解和工程能力,這是丁磊進入業(yè)界后發(fā)生的一個重要轉(zhuǎn)變。在他看來,一個數(shù)據(jù)科學家只有同時具備了:科學、工程和商業(yè)三方面的能力,才能釋放 AI 的商業(yè)潛力。

不過話雖說的好聽,但隨著時間的發(fā)展,越來越多的 AI 鼓吹者們也開始發(fā)現(xiàn),AI 的商業(yè)化之路并不好走。不久前,作為 AI 商業(yè)化領域的先驅(qū),IBM Watson 突然爆出健康部門將會裁員50%-70%的消息,為 AI 的前景蒙上了一層陰影。

 

 

(圖片說明:根據(jù)科技媒體 The Register 報道,IBM Watson 健康部門在今年五月底曾爆出大規(guī)模裁員消息,為 AI 的商業(yè)化前景蒙上了一層陰影;圖片來源:The Register 網(wǎng)站截圖)

“AI 的落地,是商業(yè)化過程中的最本質(zhì)問題。”丁磊說道。“Watson 的問題,除了有大公司僵化的管理制度外,另一方面更重要的是,醫(yī)療 AI 落地有個大問題就是收費方式不明確:AI 提供了服務后誰來買單呢?這在全世界都是一個難題。”

在 PayPal 時期,丁磊之前的數(shù)據(jù)科學團隊也正是受困于落地的難題,而無法有效讓AI和商業(yè)融合起來。在總結(jié)了前人的教訓后,丁磊提出 “AI 平臺”策略,他把這個過程稱為“運營化的數(shù)據(jù)科學”——融合數(shù)據(jù)、算法、算力和商業(yè)模式四個要素,通過高效的運營方法,讓數(shù)據(jù)科學成為產(chǎn)品,達到規(guī);。

“之前有一個美國大型零售商找到我們,說想要幫他們找到一百萬優(yōu)質(zhì)的客戶來投放優(yōu)惠券。用傳統(tǒng)的數(shù)據(jù)科學方法,收集數(shù)據(jù)、建模、調(diào)試等估計要花一個月,但是在AI 平臺上,不到一天就可以給到他們靠譜的結(jié)果。”丁磊說道,AI 平臺實際上實現(xiàn)了 AI 項目的工程化和產(chǎn)品化的過程,人類數(shù)據(jù)科學家只不過需要在其結(jié)果中稍加調(diào)整即可。

這其中,最難的技術問題不是高深的算法,而是如何將對業(yè)務的理解,融合進模型層面。“要達到一個技術和業(yè)務水乳交融的狀態(tài)。例如你如何把一個數(shù)據(jù)科學家為某個零售商家建立的業(yè)務模型,個性化地推廣到所有零售項目中?”丁磊說到,這就不僅僅是機器學習等技術能夠解決的了,需要更有業(yè)務經(jīng)驗的“數(shù)據(jù)科學家”。

換句話說,AI 平臺就像給機械化的工廠裝上了一個“大腦”,在保持高生產(chǎn)效率的情況下,還能千人千面地提供個性化的產(chǎn)品服務,這就是 AI 的自動化。“最好的數(shù)據(jù)科學家,最后就是(發(fā)明一個 AI 產(chǎn)品)把自己給‘干掉’”,丁磊笑著說。

優(yōu)秀的 AI 產(chǎn)品不會依賴于某個數(shù)據(jù)科學家本身,在離開了 PayPal 多年后,丁磊介紹,自己領導建立的那套 AI 平臺依然在不斷更新,發(fā)揮著重要作用。

“大家AI,才是真的AI”

2015 年,丁磊選擇回到中國發(fā)展。國內(nèi)日新月異的數(shù)據(jù)科學環(huán)境,讓他看到了更廣闊的市場前景。

他首先選擇了自己更熟悉的金融科技領域,加入了百度金融。他曾參與領導了百度金融與中國農(nóng)業(yè)銀行的“金融大腦”項目,在客戶畫像、精準營銷、信用評價、風險監(jiān)控、智能投顧、智能客服等方面為農(nóng)行提供AI服務。

這是丁磊的又一次 “AI 平臺” 實驗,同樣取得了不俗的業(yè)績表現(xiàn)。在他看來,如今在中國的產(chǎn)業(yè)領域,雖然以AI為賣點的公司越來越多,但只有 BAT 等頭部公司,一定程度上真正做到了 AI 的平臺化應用,大量的行業(yè)公司還沒有建立起這套業(yè)務體系。

不過也不是所有領域都適合使用 AI,在丁磊看來,滿足大規(guī)模落地商業(yè)化 AI,需要具備兩個先決條件。首先是數(shù)據(jù)的積累,數(shù)據(jù)的數(shù)量和質(zhì)量直接決定了AI發(fā)展基礎是否牢固。AI 平臺的底層是數(shù)據(jù),數(shù)據(jù)的流通和更新直接影響著上層機器學習、圖像語音處理等技術的使用效果。其次,就是所在領域的商業(yè)問題是否清晰,如果問題不夠明確,也很難用AI來處理。

在所有領域中,金融科技最符合這兩點要求,AI 平臺也最早在此落地。不過,隨著互聯(lián)網(wǎng)技術的發(fā)展,數(shù)據(jù)科學等概念已經(jīng)逐漸在其他領域開始普及,越來越多的開始討論 AI,了解數(shù)據(jù)科學的價值。

“覺得一下子就被人理解了。”丁磊笑著說,當他十年前義無反顧地鉆進 AI 的世界時,那還只是一個不被看好的小眾領域,十年過后,它卻已經(jīng)變成了大家小巷的熱點談資了,仿佛一眨眼,就“換了人間”。

在丁磊看來,AI 的商業(yè)化應用范圍非常廣,如今的中國市場就像一塊等待開墾的處女地。

丁磊為 AI 繪制了一份商業(yè)版圖,“如果橫軸是行業(yè),縱軸是職能,AI 現(xiàn)在只是填充了其中非常小的一部分。”

 

 

(圖片說明:AI 商業(yè)化的“處女地”示意圖)

在這個版圖中,零售、金融、制造、醫(yī)療、教育等是橫軸,代表不同的行業(yè)領域;營銷、風控、客服、安全等是縱軸,代表不同的職能方向。二者共同構(gòu)成了一個二維商業(yè)矩陣。對于每個行業(yè)中的相關職能,AI 都可以探索相關應用場景。

“以后的行業(yè)要變成 AI inside (AI 驅(qū)動,這個說法是相較于之前的 Intel Inside,芯片驅(qū)動)。AI 會成為行業(yè)的決策引擎,取代的是在戰(zhàn)術層面上需要人工干預的場景,AI 能夠持續(xù)有效地讓企業(yè)在最佳狀態(tài)下運行”,丁磊說道,“而且AI帶來的效果不僅是‘優(yōu)化’,而是革命性的、成倍數(shù)的增長,這才是AI的能力,真正為行業(yè)賦能。”

 

丁磊,美國俄亥俄州立大學計算機系博士,前百度金融首席數(shù)據(jù)科學家,曾在美國擔任跨國公司 PayPal Inc.的全球消費者數(shù)據(jù)科學部門負責人,領導建立了服務全球數(shù)億用戶和數(shù)百萬商家的人工智能平臺。并曾在哥倫比亞大學和 IBM Watson 研究院工作,具有在人工智能、數(shù)據(jù)科學、金融等領域十多年的從業(yè)經(jīng)驗,在 IEEE 會刊和頂級學術會議等發(fā)表高質(zhì)量論文逾 20 篇,獲得美國專利 4 項,擔任 20 多個權(quán)威國際期刊和專業(yè)會議的特約審稿人或委員會成員,并擁有斯坦福大學的高級項目管理證書。

標簽: 安全 大數(shù)據(jù) 大數(shù)據(jù)平臺 電商 電商網(wǎng) 電商網(wǎng)站 谷歌 互聯(lián)網(wǎng) 互聯(lián)網(wǎng)技術 金融 媒體 數(shù)據(jù)分析 推廣 網(wǎng)絡 移動互聯(lián) 移動互聯(lián)網(wǎng) 優(yōu)惠

版權(quán)申明:本站文章部分自網(wǎng)絡,如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:什么是大數(shù)據(jù)?如何成為大數(shù)據(jù)的技術大牛?

下一篇:NIST全球權(quán)威人臉識別算法測試結(jié)果公布,前五名中三名來自中國