中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

起底讓人類汗顏的DeepMind:竟是個(gè)谷歌大包袱!

2018-07-12    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用
7月11日?qǐng)?bào)道,自在國(guó)際圍棋、國(guó)際象棋戰(zhàn)勝頂尖棋手后,上周DeepMind又在《雷神之錘III競(jìng)技場(chǎng)》發(fā)威,雙人組隊(duì)擊敗頂級(jí)人類玩家,小組勝率高達(dá)到74%。

對(duì)于關(guān)注人工智能(AI)領(lǐng)域的人而言,DeepMind絕不是個(gè)陌生的名字。自2016年AlphaGo首次擊敗韓國(guó)圍棋冠軍李世石,DeepMind AI展開(kāi)了在游戲領(lǐng)域?qū)敿馔婕业拈L(zhǎng)期挑戰(zhàn)。

然而,在一次次刷新人類紀(jì)錄的表面風(fēng)光之后,DeepMind面臨的是虧損嚴(yán)重、人員流失和可能被谷歌拋棄的生存危機(jī)。換句話講,DeepMind每一次刷的存在感,背后都是淚。

又打敗人類,對(duì)游戲上癮的AI公司

自2016年AlphaGo以4:1打敗韓國(guó)圍棋冠軍李世石以來(lái),DeepMind在游戲領(lǐng)域越戰(zhàn)越勇,不斷研發(fā)出新的AI系統(tǒng),挑戰(zhàn)人類的極限。2016年6月,DeepMind訓(xùn)練的AI系統(tǒng)在雅達(dá)利游戲《 Montezuma’s revenge》達(dá)到了大師技巧。半年后, 在中國(guó)奕城圍棋網(wǎng)和野狐圍棋網(wǎng)快棋對(duì)決數(shù)十位中日韓圍棋高手、連續(xù)60局無(wú)一敗績(jī)的Master被曝出是DeepMind的作品,這個(gè)新AlphaGo系統(tǒng)在2017年以3:0戰(zhàn)勝排名世界第一的職業(yè)圍棋選手柯潔。

▲AlphaGo和李世石對(duì)戰(zhàn)

▲AlphaGo和李世石對(duì)戰(zhàn)

如果你在去年12月之前問(wèn)任何一個(gè)專業(yè)國(guó)際象棋選手,市場(chǎng)上最強(qiáng)大的商用國(guó)際象棋軟件是什么?你可能聽(tīng)到最多的答案就是Stockfish、Houdini和Komodo,這三個(gè)軟件可以比任何專業(yè)棋手都有更出色的下棋表現(xiàn)。

不過(guò)到了12月6日,一切都改變了。在AlphaGo退役5個(gè)月后,DeepMind推出AlphaGo系列的新版本——AlphaGo Zero,只用4個(gè)小時(shí)的訓(xùn)練時(shí)間就從零開(kāi)始學(xué)會(huì)了國(guó)際象棋的規(guī)則,并在100場(chǎng)比賽中取得28勝72平的極佳戰(zhàn)績(jī),其突出表現(xiàn)已然超過(guò)Stockfish。國(guó)際象棋游戲使用Elo進(jìn)行評(píng)級(jí),專業(yè)玩家評(píng)分在1800到2000之間,大師級(jí)別玩家的評(píng)分在2500以上,Stockfish的評(píng)分在3300左右,而AlphaGo Zero經(jīng)評(píng)估后可能在4000左右。此外,AlphaGo Zero還有訓(xùn)練3天打敗舊版AlphaGo、訓(xùn)練40天打敗Master、訓(xùn)練2小時(shí)打敗最強(qiáng)日本將棋程序Elmo的戰(zhàn)績(jī)。

▲AlphaGo和Stockfish國(guó)際象棋大戰(zhàn)復(fù)盤

▲AlphaGo和Stockfish國(guó)際象棋大戰(zhàn)復(fù)盤

除了名滿天下的AlphaGo系列,DeepMind訓(xùn)練智能體通過(guò)觀看Youtube等視頻自主學(xué)習(xí)超級(jí)瑪麗等游戲。

上周,DeepMind的游戲征途有了新的里程碑——在《雷神之錘III競(jìng)技場(chǎng)(Quake III Arena)》奪旗游戲中和人類隨機(jī)組隊(duì)打團(tuán)戰(zhàn),擊敗了人類玩家。

▲《雷神之錘》游戲畫面

▲《雷神之錘》游戲畫面

在DeepMind正在推進(jìn)的研究中,關(guān)注度最大的即是《星際爭(zhēng)霸 Ⅱ》。2017年8月,DeepMind宣布開(kāi)始訓(xùn)練AI玩暴雪公司旗下的《星際爭(zhēng)霸 II》游戲。當(dāng)時(shí)其顧預(yù)言,計(jì)劃讓AI在五年后戰(zhàn)勝《星際爭(zhēng)霸》世界冠軍。

《星際爭(zhēng)霸》是一款極其復(fù)雜的戰(zhàn)略游戲,需要玩家高度集中的精神力、超強(qiáng)的靈敏度和戰(zhàn)略決策智慧。這款游戲可以充分考驗(yàn)AI的即時(shí)戰(zhàn)略和人機(jī)對(duì)抗協(xié)作能力。它要求AI學(xué)習(xí)在資源有限的情況下平衡發(fā)展,學(xué)會(huì)如何發(fā)展高科技、出兵種對(duì)抗以及如何調(diào)兵遣將來(lái)保證利益最大化。這些涵蓋了AI亟待解決的三大問(wèn)題:一是在有限視野和不完全信息的情況下做決策,二是平衡短期、中期和長(zhǎng)期的發(fā)展策略,三是處理多智能體間的合作和博弈。

紐芬蘭紀(jì)念大學(xué)(Memorial University)的計(jì)算機(jī)科學(xué)教授大衛(wèi)•丘吉爾(David Churchill)認(rèn)為,《星際爭(zhēng)霸》是如此復(fù)雜,能解決《星際爭(zhēng)霸》的AI將能解決任何其他問(wèn)題。

為什么研究人員愛(ài)讓AI玩游戲游戲?

盡管AlphaGo已經(jīng)占據(jù)國(guó)際象棋和圍棋的霸主地位,但這不意味著AI已經(jīng)具備解決實(shí)際問(wèn)題的能力。AI學(xué)習(xí)玩游戲的方法其實(shí)和人類理解游戲的方式并不相同。國(guó)際象棋和圍棋等游戲規(guī)則具有規(guī)范性,雖然復(fù)雜但規(guī)則又很穩(wěn)定,AI在這種“有限性”的前提下可以發(fā)揮它超強(qiáng)計(jì)算能力的專長(zhǎng)。盡管AI研究者們?cè)噲D增強(qiáng)AI的通用能力、使AI向人類大腦靠攏,但這一愿景目前仍然只取得了初步進(jìn)展。

游戲本身可以模擬人類現(xiàn)實(shí)生活場(chǎng)景,通過(guò)觀察人類行為,事半功倍地實(shí)現(xiàn)目標(biāo)任務(wù),幫助人類在電商和廣告行業(yè)的個(gè)性化營(yíng)銷、資源調(diào)度、自動(dòng)駕駛車輛、無(wú)人機(jī)等領(lǐng)域做做智能決策。讓AI玩游戲,可以為AI的發(fā)展帶來(lái)如下優(yōu)點(diǎn)。

1、模擬現(xiàn)實(shí)+簡(jiǎn)化過(guò)程

AI研究員熱衷于游戲的一個(gè)重要原因,是解決現(xiàn)實(shí)世界難以去直接學(xué)習(xí)和處理的難題。大多數(shù)的游戲場(chǎng)景都源于現(xiàn)實(shí)世界,是對(duì)現(xiàn)實(shí)世界的虛擬簡(jiǎn)化。用游戲訓(xùn)練AI時(shí),研究人員無(wú)需考慮硬件的維護(hù)問(wèn)題,不需要拆卸設(shè)備,還能輕易調(diào)整測(cè)試環(huán)境,這使得訓(xùn)練新AI算法的難度大大降低。如果在現(xiàn)實(shí)生活中讓機(jī)器人去做相關(guān)任務(wù),可能要消耗的財(cái)力和時(shí)間都是難以估量的。

游戲有時(shí)可以代替真實(shí)世界的復(fù)雜數(shù)據(jù)源。比如在2016年,普林斯頓大學(xué)的Arthur Filippwicz想要教汽車在不需要人類協(xié)助的情況下識(shí)別交通信號(hào),為了訓(xùn)練這個(gè)算法,他需要收集全面的包含交通信號(hào)的圖片,包括新、舊、干凈、臟亂、有遮擋、強(qiáng)光、雨、霧、黑暗等場(chǎng)景。然而,想要獲得這樣一套完整的數(shù)據(jù)集非常費(fèi)時(shí)費(fèi)力,因此Filippwicz選擇借助游戲“俠盜獵車手 V(Grand Theft Auto V)”中描繪的交通信號(hào)作為訓(xùn)練集來(lái)源,他從中拿到數(shù)千張交通信號(hào)的照片來(lái)讓他的AI系統(tǒng)進(jìn)行學(xué)習(xí)和消化。

此外,很多游戲需要不同的認(rèn)知技能。通過(guò)在不同游戲上的訓(xùn)練和學(xué)習(xí),可以幫助研究者更好的理解和建立更完善AI系統(tǒng)。

為數(shù)據(jù)中心降低能耗的任務(wù)與游戲無(wú)異,谷歌已經(jīng)使用DeepMind在2015年2月學(xué)習(xí)玩Atari游戲時(shí)相同的算法來(lái)減少其大型數(shù)據(jù)中心的耗電量。根據(jù)用戶需求的不同,服務(wù)器的能耗和散發(fā)的熱量差異很大,DeepMind的算法可以用于預(yù)測(cè)大量服務(wù)器所需的空調(diào)冷氣,幫助數(shù)據(jù)中心將制冷系統(tǒng)節(jié)能40%,并使整個(gè)數(shù)據(jù)中心的能耗降低15%。

2、遷移學(xué)習(xí)

對(duì)于一個(gè)人而言,學(xué)完一個(gè)任務(wù)再去學(xué)習(xí)另一個(gè)任務(wù)是一件毫不費(fèi)力的事情,然而這件事情對(duì)于AI來(lái)說(shuō)卻有些困難。目前大多機(jī)器學(xué)習(xí)算法都是假設(shè)訓(xùn)練集和測(cè)試集的特征分布相同,但這在現(xiàn)實(shí)中往往是不可行的,遷移學(xué)習(xí)的主要能力就是讓AI將從一個(gè)環(huán)境中學(xué)習(xí)到的知識(shí)經(jīng)驗(yàn)運(yùn)用到新環(huán)境的學(xué)習(xí)任務(wù)中,解決神經(jīng)網(wǎng)絡(luò)災(zāi)難性遺忘的問(wèn)題。

AI玩游戲的過(guò)程可以為遷移學(xué)習(xí)提供幫助。DeepMind早期的神經(jīng)網(wǎng)絡(luò)一次只能玩一個(gè)游戲,即便它在一個(gè)游戲中表現(xiàn)良好,當(dāng)把它用到另一個(gè)游戲時(shí),它必須重塑已經(jīng)搭建好的神經(jīng)網(wǎng)絡(luò)架構(gòu),“忘掉”之前學(xué)習(xí)的記憶,重新學(xué)習(xí)新的知識(shí)。要讓AI像人類大腦一樣去完成任務(wù),可以在訓(xùn)練它玩一款游戲時(shí),保留對(duì)專業(yè)知識(shí)的長(zhǎng)期記憶,并將這些知識(shí)經(jīng)驗(yàn)用到掌握其他游戲的過(guò)程之中。DeepMind在去年3月發(fā)表的論文中已經(jīng)克服這個(gè)問(wèn)題,可以使AI像人類大腦一樣同時(shí)掌握多款游戲的玩法。

3、永不停歇

用游戲訓(xùn)練還有一個(gè)好處是,沒(méi)有硬件設(shè)備等各種客觀條件的限制,AI可以自由地進(jìn)行長(zhǎng)期的訓(xùn)練。通過(guò)游戲,AI運(yùn)算性能得以提升,產(chǎn)生大量數(shù)據(jù),這方面的進(jìn)展對(duì)其他針對(duì)現(xiàn)實(shí)問(wèn)題的AI研究也很有幫助。

4、確保AI不“;^”

在研究AI技術(shù)的過(guò)程中,DeepMind等公司并沒(méi)有忽視AI的問(wèn)題和警示,DeepMind和OpenAI決定合作找到方法來(lái)預(yù)防AI帶來(lái)意外的不好結(jié)果。DeepMind讓AI只處理自己視野范圍內(nèi)所“看見(jiàn)”的問(wèn)題,不允許AI直接向運(yùn)行游戲的計(jì)算機(jī)索取坐標(biāo)等信息,就是為了避免AI走一些普通玩家在玩游戲時(shí)不會(huì)用到的“捷徑”。再以O(shè)penAI在競(jìng)艇游戲CoastRunners的實(shí)驗(yàn)為例,AI在進(jìn)行強(qiáng)化學(xué)習(xí)的過(guò)程中,發(fā)現(xiàn)自己與其快速完成任務(wù),不如一直原地打轉(zhuǎn)獲得的分?jǐn)?shù)高,這讓研究者感到擔(dān)憂。為了避免類似情況的出現(xiàn),兩家公司為AI提供更多的“人類建議”來(lái)驗(yàn)證AI的行為方式。不過(guò),花時(shí)間多次驗(yàn)審,總比讓AI一不小心發(fā)瘋就毀滅地球要好的多。

輝煌戰(zhàn)績(jī)背后的陰影

DeepMind在用AI戰(zhàn)勝人類方面已經(jīng)享譽(yù)世界,它在Alphabet集團(tuán)中可以說(shuō)是一個(gè)比較神奇的存在,自由、品牌響亮,其背后又隱藏長(zhǎng)期虧損、數(shù)據(jù)不公開(kāi)等問(wèn)題。

1、自由的獨(dú)行俠:拒絕接機(jī)器人,看不上云服務(wù)

DeepMind是一個(gè)特立獨(dú)行的公司。它的工作仍側(cè)重于理想環(huán)境下算法的開(kāi)發(fā),側(cè)重于充滿未來(lái)主義的工作。它目前擁有700多名員工,每周都會(huì)寫出描述他們工作進(jìn)展和最新成就的學(xué)術(shù)論文。

據(jù)說(shuō)當(dāng)年安卓之父Andy Rubin離職時(shí),谷歌創(chuàng)始人之一Lawrence Edward Page曾想讓DeepMind接管Google機(jī)器人部門。不過(guò)DeepMind創(chuàng)始人兼首席執(zhí)行官Demis Hassabis認(rèn)為波士頓動(dòng)力沒(méi)怎么使用AI技術(shù),這個(gè)業(yè)務(wù)會(huì)分散DeepMind的注意力,因此他拒絕了佩奇的提議。

▲DeepMind創(chuàng)始人兼首席執(zhí)行官Demis Hassabis

▲DeepMind創(chuàng)始人兼首席執(zhí)行官Demis Hassabis

此外,在VMware聯(lián)合創(chuàng)始人兼前首席執(zhí)行官Diane Greene被Google請(qǐng)來(lái)領(lǐng)導(dǎo)云計(jì)算業(yè)務(wù)部門時(shí),她曾想借助DeepMind領(lǐng)域 的超高聲譽(yù)為谷歌云服務(wù)進(jìn)行市場(chǎng)宣傳。然而,考慮到谷歌云的市場(chǎng)目標(biāo)不清晰會(huì)削弱DeepMind的品牌,DeepMind也拒絕了這個(gè)提議。

2、燒錢大佬:長(zhǎng)期負(fù)盈利,資金流向不明

擁有研究的自由,DeepMind也不得不承擔(dān)相應(yīng)的代價(jià)。

根據(jù)去年10月英國(guó)政府發(fā)布的資料,DeepMind在2016年虧損1.235億英鎊(約合1.62億美元),這與Alphabet同年總盈利190億美元相比仍然不算是小的數(shù)額。其中4020萬(wàn)英鎊(約合5270萬(wàn)美元)的收入全部來(lái)自為其母公司Alphabet的其他部門(而非外部客戶)所做的工作。DeepMind還有包括不動(dòng)產(chǎn)和計(jì)算機(jī)系統(tǒng)運(yùn)行和維護(hù)在內(nèi)的4110萬(wàn)英鎊“管理服務(wù)費(fèi)”。而最大的資金花費(fèi)則在“員工工資和其他相關(guān)成本”方面,DeepMind在工資、差旅、辦公軟硬件方面耗資達(dá)1.047億英鎊(1.37億美元),比上一年4420萬(wàn)英鎊的兩倍還多。

DeepMind的法律費(fèi)用也在飆升,從2015年的144881英鎊增至658144英鎊。據(jù)外媒猜測(cè),這高幅度上升的背后,可能和DeepMind被發(fā)現(xiàn)非法持有英國(guó)人民醫(yī)療健康信息有關(guān)。

3、神秘主義:和谷歌聯(lián)系越來(lái)越弱

DeepMind和谷歌之間的關(guān)系相當(dāng)有趣。

▲DeepMind創(chuàng)始人兼首席執(zhí)行官Demis Hassabis(左)、韓國(guó)圍棋冠軍李世石(中)、Alphabet聯(lián)合創(chuàng)始人Sergey Brin(右)的合照

▲DeepMind創(chuàng)始人兼首席執(zhí)行官Demis Hassabis(左)、韓國(guó)圍棋冠軍李世石(中)、Alphabet聯(lián)合創(chuàng)始人Sergey Brin(右)的合照

2014年1月,谷歌以4億英鎊收購(gòu)了當(dāng)時(shí)名不見(jiàn)經(jīng)傳的DeepMind公司,2015年DeepMind還屬于谷歌,在官網(wǎng)上用大大的字體寫著“DeepMind很高興成為谷歌的一部分”,但到了2015年,這條標(biāo)語(yǔ)就換成了“DeepMind很高興加入谷歌的隊(duì)伍”。

2016年,新版DeepMind官網(wǎng)上線,“谷歌”字樣已經(jīng)無(wú)跡可尋,DeepMind只在“About Us”的頁(yè)面中介紹道DeepMind是谷歌母公司Alphabet集團(tuán)的一部分。

DeepMind想要獲得研究自由,它需要Alphabet提供研究資金,卻不肯和Alphabet分享數(shù)據(jù)。

谷歌收購(gòu)DeepMind時(shí),同意建立一個(gè)道德安全委員會(huì)來(lái)確保其AI技術(shù)不會(huì)被濫用。但隨后,DeepMind一直沒(méi)有透露董事會(huì)成員和討論內(nèi)容。

根據(jù)Financial Times在今年6月發(fā)布的消息,Alphabet對(duì)DeepMind昂貴開(kāi)銷的合理性已經(jīng)產(chǎn)生懷疑。Alphabet AI部門督促DeepMind說(shuō)明其商業(yè)模式,并向董事會(huì)說(shuō)明他們的資金流向。據(jù)審查小組稱,DeepMind最終必須通過(guò)分享算法和數(shù)據(jù)或通過(guò)賺錢來(lái)證明其價(jià)值,盡管暫時(shí)不擔(dān)心Alphabet會(huì)阻止他們做想做的事,但不能保證Alphabet董事會(huì)明年會(huì)不會(huì)得出不同的意見(jiàn)和結(jié)論。

明年是谷歌收購(gòu)DeepMind五周年,隨著DeepMind來(lái)到谷歌的75名員工,包括DeepMind首席執(zhí)行官Demis Hassabis自己,都可以自行決定去留。DeepMind今后是繼續(xù)依附Alphabet的預(yù)算支持,還是像其他部門一樣獨(dú)立發(fā)展,已經(jīng)到了做出選擇的關(guān)鍵時(shí)期。

結(jié)語(yǔ):AI投資還在虧損期,DeepMind的游戲AI新路徑

目前,DeepMind的工作仍側(cè)重于理想環(huán)境下算法的開(kāi)發(fā),在建立AI系統(tǒng)、在復(fù)雜游戲中擊敗人類、學(xué)習(xí)3D空間都處于行業(yè)領(lǐng)先水平。DeepMind相信AI在更復(fù)雜的問(wèn)題也能起到和游戲中相同的作用,成為科技乃至人類創(chuàng)造力的倍增器。

雖說(shuō)AI技術(shù)在游戲中的突破終將移植到現(xiàn)實(shí)世界,目前看來(lái)這一愿景仍然遙遙無(wú)期,在現(xiàn)實(shí)世界中的數(shù)據(jù)可不像游戲中那么容易獲得。DeepMind AI在游戲方面的成功更像是學(xué)術(shù)成就,短期內(nèi)不會(huì)對(duì)企業(yè)產(chǎn)生重大影響。

盡管DeepMind在游戲方面的研究充滿未來(lái)主義色彩,但它的一些其他研究成果已經(jīng)被谷歌使用。比如,谷歌在去年10月宣布在谷歌智能助手中采用DeepMind AI模型WaveNet,使機(jī)器的發(fā)音更接近真人(不過(guò)DeepMind轉(zhuǎn)換語(yǔ)音服務(wù)的價(jià)格比亞馬遜同類競(jìng)品高了4倍);同年,谷歌借助DeepMind的算法大大降低數(shù)據(jù)中心的能耗;DeepMind的“You might also like”建議還將安卓設(shè)備上Google Play商店中個(gè)應(yīng)用安裝率提高了20%。

谷歌首席執(zhí)行官Sundar Pichai曾多次表示,谷歌未來(lái)的成功將基于AI。然而,Alphabet投注AI所花費(fèi)的巨資還不知道多久才能回本。此外,它也在AI倫理、信托基金、醫(yī)療方面和AI道德實(shí)踐方面做出努力,希望探索和理解AI在現(xiàn)實(shí)世界的影響,使AI在現(xiàn)實(shí)世界中真正發(fā)揮好的作用。

▲Alphabet在包含AI的“其他領(lǐng)域”的稅收和運(yùn)營(yíng)虧損

▲Alphabet在包含AI的“其他領(lǐng)域”的稅收和運(yùn)營(yíng)虧損

從圖中可以看出,Alphabet正因?yàn)樵诮】、機(jī)器人、連接和AI方面的研究而承受著巨額損失。2016年,這些虧損達(dá)37.7億美元,占Alphabet虧損業(yè)務(wù)部門總金額的19.8%。從整體上來(lái)看,DeepMind的虧損似乎還沒(méi)有嚴(yán)重到影響Alphabet對(duì)它的規(guī)劃。

盡管DeepMind還沒(méi)有真正開(kāi)始盈利,但它可能幫助谷歌未來(lái)占據(jù)AI高地并推動(dòng)其產(chǎn)品的進(jìn)一步發(fā)展。不過(guò)DeepMind團(tuán)隊(duì)在研究下一個(gè)重大挑戰(zhàn)的同時(shí),AI研發(fā)之路道阻且長(zhǎng),商業(yè)變現(xiàn)和長(zhǎng)期運(yùn)營(yíng)問(wèn)題也不能忽視,希望DeepMind對(duì)AI以及現(xiàn)實(shí)世界發(fā)揮的作用才剛剛開(kāi)始。【責(zé)任編輯/孟亮】

(原標(biāo)題:起底讓人類汗顏的DeepMind:竟是個(gè)谷歌大包袱!)

來(lái)源:智東西

標(biāo)簽: Google 安全 電商 服務(wù)器 谷歌 排名 通信 網(wǎng)絡(luò) 云服務(wù) 云計(jì)算 云計(jì)算業(yè)務(wù)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:高密度主機(jī)托管和企業(yè)數(shù)據(jù)中心的冷卻系統(tǒng)考慮

下一篇:數(shù)據(jù)科學(xué)中的陷阱:定性變量的處理