中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

AlphaGo的新技能學(xué)習(xí)過程

2018-07-20    來源:編程學(xué)習(xí)網(wǎng)

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

AlphaGo.png

引言

AlphaGo是google最近的一個人工智能項目,以下是百度百科的介紹:

阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序,由位于英國倫敦的谷歌(Google)旗下DeepMind公司的戴維·西爾弗、艾佳·黃和杰米斯·哈薩比斯與他們的團(tuán)隊開發(fā),這個程序利用“價值網(wǎng)絡(luò)”去計算局面,用“策略網(wǎng)絡(luò)”去選擇下子。

如何學(xué)習(xí)新技能

下面我詳細(xì)介紹一下AlphaGo是怎樣從0開始學(xué)習(xí)下子的。

  1. 研究者教會系統(tǒng)看盤面信息,其中包括黑子信息,白子信息,空著信息,圍棋規(guī)則等。
  2. 通過學(xué)習(xí)高手對弈棋譜,學(xué)習(xí)了3000萬高手落子,讓系統(tǒng)預(yù)測該如何落子,預(yù)測準(zhǔn)確率達(dá)到57% 。
  3. 通過與自己對弈2000萬局進(jìn)一步提高自己的能力,完成這一步的系統(tǒng)與第二步中的系統(tǒng)對弈達(dá)到80%的勝率。

同樣學(xué)習(xí)如何看整個盤面局勢也用類似的方法。

這里我們來分解一下整個學(xué)習(xí)的過程:

  1. 入門:第一步對應(yīng)的是一個領(lǐng)域的基本知識,掌握以后就入門了。
  2. 模仿:一直和菜鳥下棋是不會有進(jìn)步的,去模仿該領(lǐng)域高手的作品,此時就進(jìn)階了。
  3. 領(lǐng)悟:通過不停練習(xí)來提升自己的能力,逐漸形成自己的風(fēng)格,又一個高手誕生了。

通過這次AlphaGo的勝利,我覺得上面的學(xué)習(xí)方法是對學(xué)習(xí)的很好的一種抽象,整個過程可以讓一個人更好的學(xué)習(xí)掌握一個領(lǐng)域知識,下面我拿學(xué)習(xí)編程來舉個例子:
在入門階段,選擇介紹一門編程語言,學(xué)習(xí)語法以及基礎(chǔ)庫的使用,然后去看一些基礎(chǔ)的教程。
在模仿階段,這里一定要接觸高手的作品(去找該語言github上star比較多的項目),思考他們?nèi)绾稳?gòu)建一個項目,如何實現(xiàn)各個功能模塊,等到學(xué)習(xí)幾個項目之后,能夠基本理解高手為什么這么實現(xiàn)的。
在領(lǐng)悟階段,用之前學(xué)到的知識,自己嘗試去做幾個項目,不;仡欁约旱捻椖,通過重構(gòu)現(xiàn)有的代碼來提升自己的編程能力:架構(gòu),以及功能實現(xiàn)。
這時候你的編程能力也應(yīng)該是在中上層的水平了,就像AlphaGo一樣,進(jìn)入了職業(yè)選手的大門。

后記

人類在做這類學(xué)習(xí)的過程相比機器還是有優(yōu)勢的,一個是人類強大的抽象能力,還有人類的思考的能力,這大大減少了需要學(xué)習(xí)的量,可以看到機器在學(xué)習(xí)圍棋的過程中用的數(shù)據(jù)是非常大的,而人類要達(dá)到這個水平需要的學(xué)習(xí)量大大小于機器的量。

這里只進(jìn)階到了高手,和頂尖水平還是有距離的,期待AlphaGo三月份和韓國圍棋高手的對局,同樣我們也要思考頂尖高手和普通高手的差距到底在哪里,如何去跨越。

標(biāo)簽: Google 代碼 谷歌 網(wǎng)絡(luò)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:數(shù)據(jù)科學(xué)能回答什么樣的問題?

下一篇:Lambda表達(dá)式的意義