中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

人工智能組團戰(zhàn)勝人類玩家 別緊張,這只是算力上的勝利

2018-07-16    來源:移動互聯(lián)網(wǎng)資訊站

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

近日,硅谷“鋼鐵俠”馬斯克創(chuàng)立的人工智能非營利組織OpenAI 宣布,由5個神經(jīng)網(wǎng)絡(luò)組成的OpenAI Five,已經(jīng)能夠組成5v5團隊在經(jīng)典戰(zhàn)斗競技類游戲《刀塔2》(Dota2)中擊敗人類業(yè)余玩家隊伍。7月底,他們還將挑戰(zhàn)人類頂級玩家隊伍。去年,他們開發(fā)的AI就在《刀塔2》的1v1比賽中戰(zhàn)勝了人類職業(yè)玩家Dendi。

  從單挑到團戰(zhàn),展現(xiàn)集體協(xié)作能力

據(jù)報道,OpenAI Five完全通過自我對戰(zhàn)來學(xué)習(xí)打游戲,每天的對戰(zhàn)量相當(dāng)于人類的180年。也就是說,如果人一天能打10局游戲,那么AI一天就可以打10×365×180局游戲。而且,它還創(chuàng)下了驚人的硬件消耗量紀錄:256塊圖形處理器(GPU)和12.8萬個中央處理器(CPU)。

中國科學(xué)院自動化研究所研究員興軍亮告訴科技日報記者,OpenAI Five是從去年的1V1版本上發(fā)展而來的。一開始,AI隨便亂打,不斷試錯。通過強化學(xué)習(xí)算法獲得游戲獎勵信號的引導(dǎo),一段時間后它就能發(fā)現(xiàn)并記住一些具有簡單意義的動作,然后再不斷試錯自我提升,直到最后能夠更好地完成游戲目標,一對一戰(zhàn)勝人類選手!癘penAI Five就是五個AI組成一個團隊互相對戰(zhàn),團隊中的每個成員本身對應(yīng)一個獨立的AI,同樣通過強化學(xué)習(xí)打游戲,但在學(xué)習(xí)的過程中,每個AI會考慮用其他四個AI的策略去打,這樣五個AI就組成了一支團隊,去跟五個人類業(yè)余選手對戰(zhàn)!迸d軍亮說。

至于為何每天對戰(zhàn)量是人類的180年,興軍亮解釋,AI在學(xué)習(xí)時可以很快,比如在程序中把游戲時鐘調(diào)快100倍,那么AI打1天游戲就相當(dāng)于人類打100天。同時,AI一秒鐘可點擊1萬下,這個點擊速度人類根本沒法比。但在與人類對戰(zhàn)時,這是不允許的,必須有一定限制,比如每次點擊間隔不低于30—40毫秒。

這次事件之所以被比爾·蓋茨稱為“里程碑”,是因為OpenAI Five展現(xiàn)出了類似于人的長期規(guī)劃和團隊協(xié)作能力,也展現(xiàn)了極高的智能決策能力。

然而,興軍亮認為,OpenAI Five團戰(zhàn)戰(zhàn)勝的僅僅是人類業(yè)余選手,至多算一個“小小的”里程碑。諸多跡象表明,OpenAI Five存在多種局限性,遠不如AlphaGo在圍棋上取得的里程碑式突破——“完虐”人類頂級圍棋玩家。

首先,OpenAI Five打5V5團戰(zhàn)時,只能使用特定的游戲英雄,做不到隨便組合游戲角色。其次,在《星際爭霸》《刀塔2》這類復(fù)雜游戲中,OpenAI Five僅僅是再次證明,在強化學(xué)習(xí)打游戲這件事上,人工智能可通過提高現(xiàn)有算力超過人類,但在算法上并沒有太多理論創(chuàng)新。

7月28日,OpenAI將與一組頂級玩家比賽,他們的目標是在8月份擊敗國際頂級職業(yè)團隊。“OpenAI有可能在短時間內(nèi),通過自我博弈強化學(xué)習(xí),再次打贏人類頂級玩家。它此前失敗過很多次,不斷找人類PK也是為了測試算法。不過,《刀塔2》涉及長期策略規(guī)劃問題,人類可能更加擅長!迸d軍亮說。

打《刀塔》VS下圍棋,難度超過數(shù)個量級

《刀塔2》游戲?qū)τ贠penAI來說有多難?興軍亮表示,《刀塔2》由于操作和規(guī)則更為復(fù)雜,難度超過AlphaGo下圍棋的好多個數(shù)量級,5V5對戰(zhàn)難度又超過1V1對戰(zhàn)好多個數(shù)量級。

“圍棋是確定邊界、完全信息、回合制的簡單游戲,《刀塔2》是相對復(fù)雜邊界、不完全信息下、動態(tài)的實時博弈。”興軍亮說。

《星際爭霸》和《刀塔2》都屬于實時策略游戲,這類游戲本身存在的典型難題是角色空間非常大,決策周期長,在不完全信息博弈下,要猜測對方的狀態(tài),這要求AI嘗試計算出各種可能情況下的策略,瞬間擴大成高維爆炸式的搜索空間。

其次,AI團隊協(xié)作也是一個難點,這意味著AI要同時控制多個單元,進行多智能體的協(xié)作和協(xié)同,有時還要犧牲個別單元的局部利益去滿足整體利益,這是群體智能學(xué)習(xí)需要克服的重要難題。

更深層次的難點是,如何通過游戲,讓AI不是靠速度,而是靠決策和推理取勝。IBM“深藍”也是依靠強大算力將人類打敗。但“深藍”是對計算智能的突破,也就是算得比人類快,下一步人工智能界期望在認知智能上有新的突破。

涉及推理決策,邁出認知智能“一小步”

為何有人熱衷研究游戲AI?“當(dāng)前研究得比較多的語音識別、人臉識別等技術(shù)屬于感知智能,要達到正確識別,只需告訴AI某事物是什么即可。然而,更難的是認知智能,它牽涉到推理決策!迸d軍亮表示。

游戲AI涉及推理和決策問題,同時,游戲博弈體現(xiàn)的不完全信息和動態(tài)博弈特性是現(xiàn)實環(huán)境的一個很好模擬,加之游戲環(huán)境可控制,可快速運行,不會造成額外損失。興軍亮認為,“這使得游戲AI成為下一步極佳的人工智能驗證平臺!敝锌圃鹤詣踊壳霸谶M行相關(guān)游戲AI研究,在國際《星際爭霸》游戲AI大賽上取得了較好成績。

雖然OpenAI團戰(zhàn)戰(zhàn)勝人類業(yè)余選手,相當(dāng)于將人工智能的認知智能往前推進了一小步,但即便下一步它戰(zhàn)勝人類頂級選手,進一步對認知智能做出貢獻,仍舊不代表認知智能取得了真正突破。因為它沒有把認知智能的問題完全解決掉。就好比AI能夠做對一套考卷,的確可以證明分數(shù)高,但是否能說明其達到了很高的學(xué)習(xí)水平,還不能確定。

“人工智能下一階段難題,是怎么去突破認知智能。真正的認知智能還有很多問題沒有解決,比如推理過程的表示、決策優(yōu)化算法等。如何讓AI使用更少的計算量做到更好的推理和決策,讓AI消化吸收學(xué)習(xí)的速度更快等!迸d軍亮認為,無需擔(dān)心機器能在所有問題上戰(zhàn)勝人類,這件事離我們還相當(dāng)遙遠。

倫敦大學(xué)計算機學(xué)院教授汪軍說,AlphaGo之后,AI領(lǐng)域的下一大挑戰(zhàn)是多智能體強化學(xué)習(xí)(MARL),即讓多個智能體學(xué)會合作與競爭!兜端贰缎请H爭霸》還有更多人熟悉的《王者榮耀》,都屬于多智能體強化學(xué)習(xí)。

“游戲AI上的算法突破,可以遷移應(yīng)用在互聯(lián)網(wǎng)廣告、自動駕駛和機器人導(dǎo)航等場景,只是沒辦法自動適應(yīng)其他模型,比如游戲AI不可能直接去自動駕駛。遷移過程需要人的參與,人會根據(jù)應(yīng)用特點,從程序上設(shè)計問題的輸入輸出,從優(yōu)化目標上也要做相應(yīng)調(diào)整。游戲打輸沒關(guān)系,但自動駕駛AI算法一旦失敗,面臨的損失是人類無法承受的,所以這些領(lǐng)域上的AI算法應(yīng)用周期會更長,只有經(jīng)過更嚴格的測試,非常成熟可靠時才可以運用。”興軍亮說。

標簽: 互聯(lián)網(wǎng) 互聯(lián)網(wǎng)資訊 搜索 網(wǎng)絡(luò) 移動互聯(lián) 移動互聯(lián)網(wǎng)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:Alldocube X平板來襲:10.5英寸高品質(zhì)AMOLED屏+8000mAh大電池

下一篇:三星希望在5G的3.5GHz頻段上擊敗華為