中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

TensorFlow 等“開源陷阱",會(huì)掐住中國 AI 企業(yè)的命門嗎?

2019-06-11    來源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬Linux鏡像隨意使用

近來美國基于出口管制條例(EAR)規(guī)范,要求多個(gè)不同領(lǐng)域的企業(yè)、組織不得與特定的中國企業(yè)往來,這其中除了已為外界所知的原料、芯片、零部件、軟件以外,也包括不同形式的技術(shù)標(biāo)準(zhǔn)與產(chǎn)業(yè)聯(lián)盟組織。這些企業(yè)或組織與中國企業(yè)之間的往來,多半還是基于封閉式條件環(huán)境下的往來關(guān)系,通過商業(yè)協(xié)議或是申請(qǐng)加入組織的條件。但相較于此,對(duì)于部分開源(Open source) 的資源,未來是不是也會(huì)受到美國出口管制條例的限制,這將是另一個(gè)值得關(guān)注的重點(diǎn)。

美國出口管制陰影籠罩,開源架構(gòu)不等于自主可控

在所謂的開源資源中,以開源項(xiàng)目的主體來看,只要是注冊(cè)在美國本土的開源基金會(huì)或開源項(xiàng)目提供者,就有可能受到美國法令的管制。以 Linux 基金會(huì)網(wǎng)站上的資料顯示,其旗下的部分開發(fā)項(xiàng)目確實(shí)各自依其不同的規(guī)范提報(bào)申請(qǐng)出口審查、并取得許可。另外在 Apache 基金會(huì)的部分,則是原本就規(guī)范所有項(xiàng)目都必須遵守美國出口管制規(guī)定。

 

 

圖丨 Linux 基金會(huì)網(wǎng)頁上對(duì)于旗下開源項(xiàng)目受出口管制規(guī)定限制的申請(qǐng)狀況(來源:Linux 基金會(huì))

而除了開源基金會(huì)的項(xiàng)目外,在所謂的開源碼托管平臺(tái)上的項(xiàng)目,也同樣會(huì)受到美國出口管制規(guī)定的限制,特別是由美國企業(yè)所擁有的平臺(tái),例如去年被微軟收購的 GitHub。前不久,GitHub 就在其使用規(guī)范中調(diào)整凸顯相關(guān)文字,強(qiáng)調(diào) GitHub 上的使用與相關(guān)活動(dòng)必須遵守美國出口管制規(guī)范。

另外,在其他的開源項(xiàng)目部分,也依循同樣的思維模式,也就是若其所屬主體,或者是擁有此一開源項(xiàng)目的企業(yè)受到美國出口管制的規(guī)范,則這些開源項(xiàng)目也同樣受限,例如 Google 的 TensorFlow。

以此就延伸出一個(gè)問題,這些過去被認(rèn)為是“開源”的技術(shù)資源,其較大的優(yōu)勢(shì)與特性,就在于開放架構(gòu),但在如今美國動(dòng)用了極端手段的情況下,原本開源項(xiàng)目較大的特性——“開放”被戳破了,原本合理使用就不存在侵權(quán)問題的開發(fā)項(xiàng)目或產(chǎn)品技術(shù),突然暴露在可能侵權(quán)的風(fēng)險(xiǎn)中。這牽涉到的一個(gè)問題就在于,原本是以所謂的“自主可控”為出發(fā)點(diǎn)、選擇采用開源架構(gòu)所開發(fā)的技術(shù)與產(chǎn)品,但到最后居然還是逃不過被掐住脖子的陷阱嗎?

以現(xiàn)在的發(fā)展?fàn)顩r來看,雖然表面上只有華為受到影響,但長期來看,在未來中國企業(yè)發(fā)展自有核心能力技術(shù)產(chǎn)品解決方案的道路上,原本基于全球技術(shù)開發(fā)共生體系所運(yùn)行的開源合作項(xiàng)目,也可能隨時(shí)因?yàn)槊绹蚱渌麌业囊患埥睿妥尣糠制髽I(yè)開發(fā)的產(chǎn)品陷入開發(fā)源碼技術(shù)升級(jí)斷炊,甚至可能遭控不當(dāng)使用的侵權(quán)風(fēng)險(xiǎn)。

曾經(jīng)在百度、華為負(fù)責(zé) AI 自有架構(gòu)技術(shù)開發(fā)項(xiàng)目的第四范式創(chuàng)始人、CEO 戴文淵在接受 DeepTech 專訪時(shí)就認(rèn)為,國內(nèi)企業(yè)在使用開源系統(tǒng)開發(fā)產(chǎn)品時(shí),應(yīng)該關(guān)注到開源系統(tǒng)的背后是什么?必須要理解的是,并不是開源就是“自主可控”。

事實(shí)上,在 2017 年 Facebook 修改其 React 開源框架協(xié)議,就曾經(jīng)在國內(nèi)互聯(lián)網(wǎng)業(yè)界造成很大的震動(dòng),因?yàn),國?nèi)有許多互聯(lián)網(wǎng)公司的產(chǎn)品都是使用 React 框架進(jìn)行開發(fā)。戴文淵表示,在開源系統(tǒng)背后,也要看到底是一個(gè)民主的社區(qū),還是背后其實(shí)是存在一個(gè)巨頭的操控,如果是由巨頭企業(yè)操控的開源社區(qū),包括像 GitHub 類似的事件就是如此,這也會(huì)觸動(dòng)更多人進(jìn)而去思考“開源”與“自主可控”之間的關(guān)系。

大量使用開源的中國 AI 應(yīng)用,會(huì)是下一個(gè)被卡住的嗎?

過去幾年中國 AI 的快速發(fā)展受到全球矚目,從 2018 年開始,就持續(xù)有不同單位的研究統(tǒng)計(jì)報(bào)告指出,從論文數(shù)、論文引用數(shù)、甚至是 AI 技術(shù)專利申請(qǐng)數(shù)量來看,中國即將、甚至是已經(jīng)超越美國。但即使如此,在近來的科技封鎖禁令風(fēng)波中,還是凸顯了一個(gè)值得深究的問題:中國 AI 研究與應(yīng)用科技的發(fā)展已經(jīng)脫離了被“卡脖子”的階段了嗎?而若以當(dāng)前開源項(xiàng)目也可能隨時(shí)受到出口禁令影響的狀況來看,下一個(gè)被波及的會(huì)是中國的 AI 企業(yè)嗎?

 

 

圖丨第四范式創(chuàng)始人、CEO 戴文淵:2017 年《麻省理工科技評(píng)論》“35 歲以下創(chuàng)新 35 人”(Innovators Under 35 China)中國區(qū)榜單獲獎(jiǎng)?wù)?/p>

戴文淵在專訪中特別提到:“中國在過去的十年時(shí)間里,在 AI 領(lǐng)域建立了一個(gè)領(lǐng)先優(yōu)勢(shì),但最近我發(fā)現(xiàn)有一定的問題,這個(gè)問題來自于什么?其實(shí)是我們可能更偏實(shí)用主義一些,10 年前我們?yōu)榱巳プ鲆粋(gè)應(yīng)用,因?yàn)槟菚r(shí)候沒有任何的基礎(chǔ)設(shè)施,沒有 TensorFlow、甚至連 Spark 都沒有,而那時(shí)我們?cè)诎俣,為了把百度的鳳巢系統(tǒng)做出來,需要從底層一行一行地寫代碼,最后才把一個(gè)應(yīng)用做出來。從這一點(diǎn)來看,其實(shí)中國的開發(fā)者是有能力從底層一層層往上寫的。但是當(dāng)我們有現(xiàn)成的東西可以直接拿來用的時(shí)候,比如 TensorFlow,出于實(shí)用主義大家可能就不太愿意去關(guān)注底層了,就直接拿過來,把應(yīng)用做出來。”

但相較于當(dāng)年,近幾年有越來越多的開源工具可以快速導(dǎo)入開發(fā)應(yīng)用,許多開發(fā)者很自然地會(huì)選擇開源工具,加快應(yīng)用開發(fā)的速度,這原本應(yīng)該是科技發(fā)展進(jìn)步的推動(dòng)力,只是走到現(xiàn)在這個(gè)時(shí)點(diǎn)上,強(qiáng)調(diào)快速導(dǎo)入開發(fā)的“實(shí)用主義”似乎反而讓中國開發(fā)者、甚至是中國的科技企業(yè)落入了另一個(gè)失去自主可控權(quán)的難題中。

對(duì)此,過去曾經(jīng)參與過百度、華為重要自有底層技術(shù)項(xiàng)目開發(fā)的戴文淵表示擔(dān)憂:“我看到最近這幾年的趨勢(shì),當(dāng) TensorFlow 出來了以后,越來越少的企業(yè)去從底層開始考慮,越來越少的企業(yè)對(duì)自己的技術(shù)是自主可控的,這其實(shí)有很大的風(fēng)險(xiǎn)。”

事實(shí)上,近年中國企業(yè)有許多的應(yīng)用是建構(gòu)在美國大型企業(yè)所掌控的開源架構(gòu)上,例如像是 TensorFlow、Caffe 等等,這些看似開放的開源架構(gòu),但在實(shí)際運(yùn)作上卻還是有許多規(guī)則的限制。戴文淵以他的實(shí)際經(jīng)驗(yàn)提到:“比方說我們想去提交代碼,雖然說它是一個(gè)社區(qū),但是這個(gè)社區(qū)是有一個(gè)巨頭所掌控,其他的人可以在這個(gè)社區(qū)里活動(dòng),但你想去改 TensorFlow 的核心代碼,巨頭一定是不會(huì)同意的。并且他想封鎖,完全取決于他自己的策略。”

以目前國內(nèi) AI 企業(yè)的動(dòng)作來看,不論是第四范式或者是商湯等其他企業(yè),都曾對(duì)自有架構(gòu)提出過明確的主張與想法,這些企業(yè)的最主要概念都在于,要提供一個(gè)不受外在變數(shù)影響、能夠穩(wěn)定提供應(yīng)用服務(wù)的產(chǎn)品,而要做到這一點(diǎn),就不只是單純地求快、求方便,而是基于更長期的發(fā)展需求。

戴文淵回顧過去第四范式選擇從底層自己一路開發(fā)的作法,他認(rèn)為關(guān)鍵在于希望能夠保持算法的靈活度,特別是有些算法如果要在 TensorFlow 上實(shí)現(xiàn),是需要去改 TensorFlow 的底層,但這其實(shí)是不被容許的,但如果是自有的底層框架,自然是想改就能改。

除了靈活度外,還有另一個(gè)值得注意的關(guān)鍵在于對(duì)客戶負(fù)責(zé),特別是要對(duì)客戶運(yùn)營的安全性負(fù)責(zé)。戴文淵表示,第四范式的客戶很多都是國計(jì)民生行業(yè)的頭部企業(yè),如金融、能源等,源代碼如果暴露在外面,黑客就有機(jī)會(huì)針對(duì)一個(gè)防偽冒的系統(tǒng),根據(jù)其獲得的數(shù)據(jù)以及代碼的計(jì)算邏輯,去探測出模型可能長什么樣,然后進(jìn)行攻擊;趯(duì)客戶負(fù)責(zé)的角度來看,提供從底層開始自主可控的服務(wù)是經(jīng)過多方面考慮的結(jié)果。

根據(jù)業(yè)界一個(gè)非正式的統(tǒng)計(jì)數(shù)字,在現(xiàn)有的中國開發(fā)者群體中使用 TensorFlow 的占比大概超過 70%,但戴文淵認(rèn)為,實(shí)際上會(huì)受影響的應(yīng)用產(chǎn)品比例可能低于這個(gè)數(shù)字,因?yàn)橛行┐笮推髽I(yè)所提供的應(yīng)用服務(wù),其實(shí)都是更早之前就已經(jīng)搭建完成的,特別是一些目前在市場上應(yīng)用較為廣泛、市場份額較大的應(yīng)用,多半都不是使用 TensorFlow 之類的開源框架,因?yàn)檫@些應(yīng)用開發(fā)的時(shí)間遠(yuǎn)早于這些開源項(xiàng)目推出的時(shí)間,但不可否認(rèn),有些應(yīng)用在后來可能會(huì)開始用一些 TensorFlow 進(jìn)行開發(fā)。

不可否認(rèn)的是,TensorFlow 或其他開源框架的使用其實(shí)已經(jīng)相當(dāng)普遍,面對(duì)應(yīng)用產(chǎn)品可能出現(xiàn)的問題,其實(shí)也已經(jīng)有企業(yè)開始思考如何補(bǔ)漏,以第四范式為例,就已開始研究能讓 TensorFlow 代碼在第四范式自主開發(fā)的“先知平臺(tái)”引擎上運(yùn)行,但上層看起來仍然是 TensorFlow 的 Script。

對(duì)于很多 AI 解決方案供應(yīng)商而言,目前已經(jīng)導(dǎo)入企業(yè)客戶運(yùn)行的應(yīng)用產(chǎn)品不能就此中斷或完全替換,因此必須要能夠提供另一條路徑,未來若真出現(xiàn)被封鎖的狀況,還能夠讓客戶把所有代碼遷移到自主開發(fā)的系統(tǒng)里,但不可否認(rèn)的是,這將會(huì)有非常大的工作量。

中國 AI 軟件領(lǐng)先優(yōu)勢(shì),將撬動(dòng)中國 AI ASIC、服務(wù)器硬件全新機(jī)遇

對(duì)比中國與美國的 AI 框架的先進(jìn)程度,戴文淵認(rèn)為,中國國產(chǎn)框架技術(shù)和美國比是沒有任何劣勢(shì)的,即使是和 TensorFlow 比,主要的差別還是在于使用人數(shù)的多寡,TensorFlow 的使用者數(shù)量確實(shí)是比較大。

但相較于對(duì)中國國產(chǎn) AI 框架技術(shù)能力抱持樂觀看法,戴文淵認(rèn)為影響中國 AI 或者是整體科技發(fā)展較大的風(fēng)險(xiǎn)還是在硬件上,因?yàn)橹袊c美國之間的差距確實(shí)比較明顯,但這不代表中國就沒有機(jī)會(huì)了,反而是在 AI 科技應(yīng)用發(fā)展上,因?yàn)橹袊?AI 框架軟件技術(shù)等等都有一定的競爭力,所以,如果能夠與硬件有更好的整合,特別是在像是 AI 服務(wù)器的發(fā)展上。

戴文淵認(rèn)為:“中國要能夠趕上美國,要做出像英特爾(Intel)這樣水平的 CPU,恐怕還是有一定難度的。雖說現(xiàn)在也有國產(chǎn) CPU,但還是有一定的差距,甚至這個(gè)差距可能并不是一年兩年能追得上的,但如果就 AI 計(jì)算來看,我們發(fā)現(xiàn)對(duì) CPU 的依賴其實(shí)會(huì)越來越少,CPU 原來是一個(gè)通用的計(jì)算單元和一個(gè)中央處理器,中央處理器的價(jià)值依然還在,但通用計(jì)算單元的價(jià)值則變得越來越低,因?yàn)樵絹碓蕉嗟挠?jì)算可以放到 ASIC 上去算。”

觀察國內(nèi) AI 企業(yè)在過去 1 年多來的發(fā)展路徑,可以發(fā)現(xiàn) AI 算法應(yīng)用與硬件的融合是非常明顯的方向,不論是通過開發(fā)自有 ASIC,或者是開發(fā)自有的加速卡、服務(wù)器等等,都是許多 AI 企業(yè)看準(zhǔn)的趨勢(shì)。外界或許會(huì)將此解讀為更容易商業(yè)化落地實(shí)現(xiàn)收入的作法,但就技術(shù)發(fā)展的層次來看,AI 的軟硬整合確實(shí)有其既有技術(shù)發(fā)展的邏輯。

戴文淵就以第四范式自身的例子說明這個(gè)邏輯:“為什么我們能做加速卡,原因是我們能做軟件,我們了解軟件,所以可以把它硬件化,而且這是個(gè)未來趨勢(shì)。因?yàn)?AI 系統(tǒng)是非常有套路的,不像編程語言,可以任意地去寫,AI 是按照步驟的,有非常固定的計(jì)算模式。如果說今天讓我們?nèi)フ娴淖鲆粋(gè)通用服務(wù)器,短期內(nèi)仍有很大的差距,但這是我看到這個(gè) AI 時(shí)代較大的機(jī)會(huì),也是中國有可能趕上的較大機(jī)會(huì),因?yàn)檫@樣的 AI 服務(wù)器來自一個(gè)軟件驅(qū)動(dòng)的硬件設(shè)計(jì),不是硬件系統(tǒng)的硬件設(shè)計(jì),而中國在軟件部分現(xiàn)在是領(lǐng)先的,所以在做軟件驅(qū)動(dòng)的硬件設(shè)計(jì)時(shí),能夠獲得一定的領(lǐng)先優(yōu)勢(shì)。目前第四范式的軟件與國內(nèi)硬件廠商合作所取得的性能效果,并不亞于 TensorFlow+美國硬件,硬件的差距在靠軟件和加速芯片追回。”

戴文淵就說:“到今天,我們走的這條路也是必經(jīng)之路。因?yàn),?dāng)我們開始去改造一些企業(yè)場景時(shí),一旦牽涉到大量的場景被改造,馬上就意味著算力不夠用了,算力不夠用,也意味著必須要去優(yōu)化硬件,但這不是說去買一個(gè)更好的 CPU、GPU 就可以的,因?yàn)?CPU 和 GPU 并不知道你的軟件長成什么樣,我們見過的很多 GPU 服務(wù)器跑 AI 應(yīng)用是沒有性能提升的。因?yàn),很多時(shí)候瓶頸并不在 GPU 算力的問題上,它可能在網(wǎng)絡(luò)上、也可能在讀寫上,因此必須要有一個(gè)軟硬件聯(lián)合的優(yōu)化,才能充分地將性能發(fā)揮出來,所以這條路是必須要走的。”

當(dāng)我們站在當(dāng)前的轉(zhuǎn)折點(diǎn)上,面對(duì)技術(shù)開發(fā)道路的抉擇,“自主可控”不是清談議論的理想,而將是影響技術(shù)產(chǎn)品開發(fā)成功與否的長期關(guān)鍵因素。這一波美國出口管制禁令掀翻的滔天巨浪,不只沖刷出長期存在、只是隱而未現(xiàn)的缺口,從另一個(gè)角度來看,這也可能為中國科技產(chǎn)業(yè)的發(fā)展沖出一個(gè)新的機(jī)會(huì),身處其中,中國 AI 企業(yè)將有機(jī)會(huì)迎來一波新的升級(jí)蛻變。

來源:DeepTech深科技

標(biāo)簽: [db:TAGG]

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:尤瓦爾vs李飛飛:一場關(guān)于“AI威脅論”的終極對(duì)話

下一篇:五大區(qū)塊鏈快速原型工具幫你加速概念驗(yàn)證的時(shí)間