中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

Tensorflow 2.0的這些新設(shè)計(jì),你適應(yīng)好了嗎?

2018-11-30    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

 

 

來(lái)源:論智,作者:Bot

幾天前,Tensorflow剛度過(guò)自己的3歲生日,作為當(dāng)前最受歡迎的機(jī)器學(xué)習(xí)框架,Tensorflow在這個(gè)寶座上已經(jīng)盤踞了近三年。無(wú)論是成熟的Keras,還是風(fēng)頭正盛的pytorch,它的地位似乎總是無(wú)法被撼動(dòng)。而就在即將到來(lái)的2019年,Tensorflow 2.0將正式入場(chǎng),給暗流涌動(dòng)的框架之爭(zhēng)再燃一把火。

如果說(shuō)兩代Tensorflow有什么根本不同,那應(yīng)該就是Tensorflow 2.0更注重使用的低門檻,旨在讓每個(gè)人都能應(yīng)用機(jī)器學(xué)習(xí)技術(shù)?紤]到它可能會(huì)成為機(jī)器學(xué)習(xí)框架的又一個(gè)重要里程碑,本文會(huì)介紹1.x和2.x版本之間的所有(已知)差異,重點(diǎn)關(guān)注它們之間的思維模式變化和利弊關(guān)系。

通過(guò)閱讀這篇文章,熟悉Tensorflow的老用戶可以盡早轉(zhuǎn)變思維,適應(yīng)新版本的變化。而新手也可以直接以Tensorflow 2.0的方式思考,至少目前沒(méi)有必要急著去學(xué)習(xí)別的框架。

Tensorflow 2.0:為什么?何時(shí)?

Tensorflow 2.0的開(kāi)發(fā)初衷是制作一個(gè)更簡(jiǎn)單易用的Tensorflow。

第一個(gè)向公眾透露項(xiàng)目具體開(kāi)發(fā)內(nèi)容的人是Google Brain的工程師Martin Wicke,我們可以在他的公告郵件列表里找到Tensorflow 2.0的蛛絲馬跡。在這里,我們對(duì)它做一些簡(jiǎn)單提要:

♦ Tensorflow 2.0的核心功能是動(dòng)態(tài)圖機(jī)制Eager execution。它允許用戶像正常程序一樣去編寫(xiě)、調(diào)試模型,使TensorFlow更易于學(xué)習(xí)和應(yīng)用。

♦ 支持更多平臺(tái)、更多語(yǔ)言,通過(guò)標(biāo)準(zhǔn)化API的交換格式和提供準(zhǔn)線改善這些組件之間的兼容性。

♦ 刪除已棄用的API并減少重復(fù)的API數(shù),避免給用戶造成混淆。

♦ 2.0版的設(shè)計(jì)對(duì)公眾開(kāi)放:社區(qū)可以和Tensorflow開(kāi)發(fā)人員一起工作,共同探討新功能。

♦ 兼容性和連續(xù)性:Tensorflow 2.0會(huì)提供Tensorflow 1.x的兼容性模塊,也就是它會(huì)內(nèi)置所有Tensorflow 1.x API的模塊。

♦ 硬盤兼容性:只需修改一些變量名稱,Tensorflow 1.x中導(dǎo)出的模型(checkpoints和模型freeze)就能和Tensorflow 2.0兼容。

♦ tf.contrib退出歷史舞臺(tái)。其中有維護(hù)價(jià)值的模塊會(huì)被移動(dòng)到別的地方,剩余的都將被刪除。

換言之,如果你在這之前從沒(méi)接觸過(guò)Tensorflow,你是幸運(yùn)的。但是,如果你和我們一樣是從0.x版本用起的,那么你就可能得重寫(xiě)所有代碼庫(kù)——雖然官方說(shuō)會(huì)發(fā)布轉(zhuǎn)換工具方便老用戶,但這種工具肯定有很多bug,需要一定的手動(dòng)干預(yù)。

而且,你也必須開(kāi)始轉(zhuǎn)變思維模式。這做起來(lái)不容易,但真的猛士不就應(yīng)該喜歡挑戰(zhàn)嗎?

所以為了應(yīng)對(duì)挑戰(zhàn),我們先來(lái)適應(yīng)第一個(gè)巨大差異:移除tf.get_variable,tf.variable_scope,tf.layers,強(qiáng)制轉(zhuǎn)型到基于Keras的方法,也就是用tf.keras。

關(guān)于Tensorflow 2.0的發(fā)布日期,官方并沒(méi)有給出明確時(shí)間。但根據(jù)開(kāi)發(fā)小組成員透露的消息,我們可以確定它的預(yù)覽版會(huì)在今年年底發(fā)布,官方正式版可能會(huì)在2019年春季發(fā)布。

所以留給老用戶的時(shí)間已經(jīng)不多了。

Keras(OOP)vs Tensorflow 1.x

在GitHub上,RFC:TensorFlow 2.0中的變量這份意見(jiàn)稿已經(jīng)被官方接受,它可能是對(duì)現(xiàn)有代碼庫(kù)影響最大的RFC,值得參考。

我們都知道,在Tensorflow里,每個(gè)變量在計(jì)算圖中都有一個(gè)唯一的名稱,我們也已經(jīng)習(xí)慣按照這種模式設(shè)計(jì)計(jì)算圖:

♦ 哪些操作連接我的變量節(jié)點(diǎn):把計(jì)算圖定義為連接的多個(gè)子圖,并用tf.variable_scope在內(nèi)部定義每個(gè)子圖,以便定義不同計(jì)算圖的變量,并在Tensorboard中獲得清晰的圖形表示。

♦ 需要在執(zhí)行同一步驟時(shí)多次使用子圖:一定要用tf.variable_scope里的reuse參數(shù),不然Tensorflow會(huì)生成一個(gè)前綴為_(kāi)n的新計(jì)算圖。

♦ 定義計(jì)算圖:定義參數(shù)初始化節(jié)點(diǎn)(你調(diào)用過(guò)幾次tf.global_variables_initializer()?)。

♦ 把計(jì)算圖加載到Session,運(yùn)行。

下面,我們就以在Tensorflow中實(shí)現(xiàn)簡(jiǎn)單的GAN為例,更生動(dòng)地展現(xiàn)上述步驟。

Tensorflow 1.x的GAN

要定義GAN的判別器D,我們一定會(huì)用到tf.variable_scope里的reuse參數(shù)。因?yàn)槭紫任覀儠?huì)把真實(shí)圖像輸入判別器,之后把生成的假樣本再輸進(jìn)去,在且僅在最后計(jì)算D的梯度。相反地,生成器G里的參數(shù)不會(huì)在一次迭代中被用到兩次,所以沒(méi)有擔(dān)心的必要。

 

 

當(dāng)這兩個(gè)函數(shù)被調(diào)用時(shí),Tensorflow會(huì)默認(rèn)在計(jì)算圖內(nèi)部定義兩個(gè)不同的子圖,每個(gè)子圖都有自己的scope(生成器/判別器)。請(qǐng)注意,這個(gè)函數(shù)返回的是定義好的子圖的張量,而不是子圖本身。

為了共享D這個(gè)子圖,我們需要定義兩個(gè)輸入(真實(shí)圖像/生成樣本),并定義訓(xùn)練G和D所需的損失函數(shù)。

 

 

最后要做的是分別定義訓(xùn)練D和G所需的2個(gè)損失函數(shù)和2個(gè)優(yōu)化器。

 

函數(shù)不難,對(duì)抗訓(xùn)練的一個(gè)特點(diǎn)是把真實(shí)圖像和由G生成的圖像輸入判別器D,由后者輸出評(píng)估結(jié)果,并把結(jié)果饋送給生成器G做參考。這意味著對(duì)抗訓(xùn)練其實(shí)是分兩步走,G和D同在一個(gè)計(jì)算圖內(nèi),但在訓(xùn)練D時(shí),我們不希望更新G中的參數(shù);同理,訓(xùn)練G時(shí),我們也不希望更新D里的參數(shù)。

 

因此,由于我們?cè)谀J(rèn)計(jì)算圖中定義了每個(gè)變量,而且它們都是全局變量,我們必須在2個(gè)不同的列表中收集正確的變量并正確定義優(yōu)化器,從而計(jì)算梯度,對(duì)正確的子圖進(jìn)行更新。

 

 

到這里,我們已經(jīng)完成了上面提到的“第3步:定義計(jì)算圖”,最后是定義參數(shù)初始化節(jié)點(diǎn):

 

 

優(yōu)/缺點(diǎn)

只要正確定義了計(jì)算圖,且在訓(xùn)練循環(huán)內(nèi)和session內(nèi)使用,上述GAN就能正常訓(xùn)練了。但是,從軟件工程角度看,它有一些值得注意的點(diǎn):

♦ 用tf.variable_scope修改由tf.layers定義的(完整)變量名稱:這其實(shí)是對(duì)不同scope的變量重新用了一次tf.layers.*,導(dǎo)致的結(jié)果是定義了新scope下的一組新變量。

♦ 布爾標(biāo)志reuse可以完全改變調(diào)用tf.layers.*后的所有行為(定義/reuse)。

♦ 每個(gè)變量都是全局變量:tf.layers調(diào)用tf.get_variable(也就是在tf.layers下面調(diào)用)定義的變量可以隨處訪問(wèn)。

♦ 定義子圖很麻煩:你沒(méi)法通過(guò)調(diào)用discriminator獲得一個(gè)新的、完全獨(dú)立的判別器,這有點(diǎn)違背常理。

♦ 子圖定義的輸出值(調(diào)用generator/discriminator)只是它的輸出張量,而不是內(nèi)部所有圖的信息(盡管可以回溯輸出,但這么做很麻煩)。

♦ 定義參數(shù)初始化節(jié)點(diǎn)很麻煩(不過(guò)這個(gè)可以用tf.train.MonitoredSession和tf.train.MonitoredTrainingSession規(guī)避)。

以上6點(diǎn)都可能是用Tensorflow構(gòu)建GAN的缺點(diǎn)。

Tensorflow 2.x的GAN

前面提到了,Tensorflow 2.x移除了tf.get_variable,tf.variable_scope,tf.layers,強(qiáng)制轉(zhuǎn)型到了基于Keras的方法。明年,如果我們想用它構(gòu)建GAN,我們就必須用tf.keras定義生成器G和判別器的:這其實(shí)意味著我們憑空多了一個(gè)可以用來(lái)定義D的共享變量函數(shù)。

注:明年tf.layers就沒(méi)有了,所以你最好從現(xiàn)在就開(kāi)始適應(yīng)用tf.keras來(lái)定義自己的模型,這是過(guò)渡到2.x版本的必要準(zhǔn)備。

 

 

看到和Tensorflow的不同了嗎?在這里,generator和discriminator都返回了一個(gè)tf.keras.Model,而不僅僅是輸出張量。

在Keras里,變量共享可以通過(guò)多次調(diào)用同樣的Keras層或模型來(lái)實(shí)現(xiàn),而不用像TensorFlow那樣需要考慮變量的scope。所以我們?cè)谶@里只需定義一個(gè)判別器D,然后調(diào)用它兩次。

 

 

再重申一遍,這里我們不需要像原來(lái)那樣定義D_fake,在定義計(jì)算圖時(shí)也不用提前擔(dān)心變量共享。

之后就是定義G和D的損失函數(shù):

 

 

最后,我們要做的是定義分別優(yōu)化D和G的2個(gè)優(yōu)化器。由于用的是tf.keras,所以我們不用手動(dòng)創(chuàng)建要更新的變量列表,tf.keras.Models的對(duì)象本身就是我們要的東西。

 

 

截至目前,因?yàn)槲覀冇玫倪是靜態(tài)圖,所以還要定義變量初始化節(jié)點(diǎn):

 

 

優(yōu)/缺點(diǎn)

♦ 從tf.layers到過(guò)渡tf.keras:Keras里有所有tf.layers的對(duì)應(yīng)操作。

♦ tf.keras.Model幫我們完全省去了變量共享和計(jì)算圖重新定義的煩惱。

♦ tf.keras.Model不是一個(gè)張量,而是一個(gè)自帶變量的完整模型。

♦ 定義變量初始化節(jié)點(diǎn)還是很麻煩,但之前也提到了,我們可以用tf.train.MonitoredSession規(guī)避。

以上是Tensorflow 1.x和2.x版本的第一個(gè)巨大差異,在下文中,我們?cè)賮?lái)看看第二個(gè)差異——Eager模式。

Eager Execution

Eager Execution(動(dòng)態(tài)圖機(jī)制)是TensorFlow的一個(gè)命令式編程環(huán)境,它無(wú)需構(gòu)建計(jì)算圖,可以直接評(píng)估你的操作:直接返回具體值,而不是構(gòu)建完計(jì)算圖后再返回。它的優(yōu)點(diǎn)主要有以下幾點(diǎn):

♦ 直觀的界面。更自然地構(gòu)建代碼和使用Python數(shù)據(jù)結(jié)構(gòu),可完成小型模型和小型數(shù)據(jù)集的快速迭代。

♦ 更容易調(diào)試。直接調(diào)用ops來(lái)檢查運(yùn)行模型和測(cè)試更改,用標(biāo)準(zhǔn)Python調(diào)試工具獲取即時(shí)錯(cuò)誤報(bào)告。

♦ 更自然的流程控制。直接用Python流程控制而不是用計(jì)算圖。

簡(jiǎn)而言之,有了Eager Execution,我們不再需要事先定義計(jì)算圖,然后再在session里評(píng)估它。它允許用python語(yǔ)句控制模型的結(jié)構(gòu)。

這里我們舉個(gè)典型例子:Eager Execution獨(dú)有的tf.GradientTape。在計(jì)算圖模式下,如果我們要計(jì)算某個(gè)函數(shù)的梯度,首先我們得定義一個(gè)計(jì)算圖,從中知道各個(gè)節(jié)點(diǎn)是怎么連接的,然后從輸出回溯到計(jì)算圖的輸入,層層計(jì)算并得到最終結(jié)果。

但在Eager Execution下,用自動(dòng)微分計(jì)算函數(shù)梯度的唯一方法是構(gòu)建圖。我們得先用tf.GradientTape根據(jù)可觀察元素(如變量)構(gòu)建操作圖,然后再計(jì)算梯度。下面是tf.GradientTape文檔中的一個(gè)原因和示例:

 

 

此外,用python語(yǔ)句(如if語(yǔ)句和循環(huán)語(yǔ)句)進(jìn)行流程控制區(qū)別于靜態(tài)圖的

 

之前官方發(fā)布了一個(gè)名為Autograph的工具,它的作用是把普通Python代碼轉(zhuǎn)換成復(fù)雜的計(jì)算圖代碼,也就是允許用戶用Python直接編寫(xiě)計(jì)算圖。但它指的Python事實(shí)上并不是真正意義上的Python(比如必須定義一個(gè)函數(shù),讓它返回一個(gè)具有指定Tensorflow數(shù)據(jù)類型的元素列表),也沒(méi)法發(fā)揮編程語(yǔ)言的強(qiáng)大功能。

就個(gè)人而言,我不太喜歡Eager Execution,因?yàn)槲乙呀?jīng)習(xí)慣靜態(tài)圖了,而這個(gè)新改變有點(diǎn)像是對(duì)PyTorch的拙劣模仿。至于其他變化,我會(huì)在下面以問(wèn)答方式做簡(jiǎn)單介紹。

一問(wèn)一答

下面是我認(rèn)為從TensorFlow過(guò)渡到TensorFlow 2.0會(huì)出現(xiàn)的一些常見(jiàn)問(wèn)題。

問(wèn):如果我的項(xiàng)目要用到tf.contrib怎么辦?

你可以用pip安裝一個(gè)新的Python包,或者把tf.contrib.something重命名為tf.something。

問(wèn):如果在Tensorflow 1.x里能正常工作的東西到2.x沒(méi)法運(yùn)行了怎么辦?

不應(yīng)該存在這種錯(cuò)誤,建議你仔細(xì)檢查一下代碼轉(zhuǎn)換得對(duì)不對(duì),閱讀GitHub上的錯(cuò)誤報(bào)告。

問(wèn):我的項(xiàng)目在靜態(tài)圖上好好的,一放到Eager Execution上就不行了怎么辦?

我也遇到了這個(gè)問(wèn)題,而且目前還不知道具體原因。所以建議先不要用Eager Execution。

問(wèn):我發(fā)現(xiàn)Tensorflow 2.x里好像沒(méi)有某個(gè)tf.函數(shù)怎么辦?

這個(gè)函數(shù)很有可能只被移到別的地方去了。在Tensorflow 1.x中,很多函數(shù)會(huì)有重復(fù)、有別名,Tensorflow 2.x對(duì)這些函數(shù)做了統(tǒng)一刪減整理,也移動(dòng)了部分函數(shù)的位置。你可以在RFC:TensorFlow命名空間里找到將要新增、刪除、移動(dòng)的所有函數(shù)。官方即將發(fā)布的工具也能幫你適應(yīng)這個(gè)更新。

小結(jié)

看了這么多,相信讀者現(xiàn)在已經(jīng)對(duì)Tensorflow 2.x有了大致了解,也有了心理準(zhǔn)備。總的來(lái)說(shuō),正如大部分產(chǎn)品都要經(jīng)歷更新迭代,我認(rèn)為Tensorflow 2.x相比Tensorflow 1.x會(huì)是有明顯改進(jìn)的一個(gè)版本。最后,我們?cè)賮?lái)看一下Tensorflow的發(fā)展時(shí)間軸,回憶過(guò)去三年來(lái)它帶給我們的記憶和知識(shí)。


標(biāo)簽: Google 代碼 轉(zhuǎn)型

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:Python+數(shù)據(jù)分析:數(shù)據(jù)分析北京Python開(kāi)發(fā)的現(xiàn)狀

下一篇:學(xué)習(xí)機(jī)器學(xué)習(xí)需要理解的五個(gè)基本概念