中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

CUDA開發(fā)常見問題之基礎(chǔ)知識盤點(diǎn)

2019-02-26    來源:多智時(shí)代

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用

在2010 GPU技術(shù)大會(GTC)上,英偉達(dá)(NVIDIA)公司展示了自2009 GTC閉幕后的一年內(nèi)CUDA的發(fā)展進(jìn)程(如下圖),從中不難看出CUDA的強(qiáng)勁勢頭。當(dāng)然,在隨后的2011年這一勢頭更加明顯。而對于大量剛剛接觸CUDA的初學(xué)者來說,常常會被很多CUDA和GPU計(jì)算的相關(guān)問題所困擾。下面的內(nèi)容是對CUDA和GPU計(jì)算常見問題的解答,希望能對大家的學(xué)習(xí)過程有所幫助。

CUDA開發(fā)常見問題之基礎(chǔ)知識盤點(diǎn)

Q1:什么是CUDA?

A1:CUDA是NVIDIA公司推出的一種通用并行計(jì)算架構(gòu)。CUDA利用NVIDIA圖形處理器(GPU)的并行計(jì)算引擎解決大量復(fù)雜計(jì)算問題,比單純使用CPU效率提高數(shù)倍。

目前有超過2.5億支持CUDA的GPU已經(jīng)售出,大量的軟件開發(fā)人員已經(jīng)開始使用免費(fèi)的CUDA軟件開發(fā)工具,來解決各種專業(yè)和家庭應(yīng)用中的難題。這些難題涉及視頻和音頻處理、物理模擬、石油和天然氣勘探、產(chǎn)品設(shè)計(jì),醫(yī)療成像和科學(xué)研究等各個(gè)領(lǐng)域。

CUDA允許開發(fā)人員使用C/C++等高級編程語言編寫應(yīng)用程序,并且支持微軟DirectX和OpenCL等多種API,無縫的將現(xiàn)在和未來的開發(fā)環(huán)境融合到一起。

Q2:什么是NVIDIA Tesla?

A2:NVIDIA Tesla計(jì)算解決方案搭載世界上第一個(gè)萬億次浮點(diǎn)運(yùn)算的多核處理器,能夠?qū)崿F(xiàn)節(jié)能高效的并行計(jì)算能力。內(nèi)置448個(gè)CUDA核心的處理器(C2070)和標(biāo)準(zhǔn)C編譯器,簡化了應(yīng)用程序的開發(fā),Tesla集群能夠快速準(zhǔn)確的解決世界上最重要的計(jì)算難題。

Q3:OpenCL與CUDA有什么關(guān)系?

A3:CUDA是NVIDIA的并行計(jì)算架構(gòu)的名稱。CUDA技術(shù)包括硬件和軟件,它實(shí)現(xiàn)了在NVIDIA GPU上的計(jì)算。CUDA也將編程語言擴(kuò)展到C/C++。C/C++提供了運(yùn)行時(shí)(runtime)和API級別的驅(qū)動程序來訪問GPU硬件。CUDA也是一個(gè)龐大而活躍的生態(tài)系統(tǒng),包括大量支持庫和開發(fā)工具,CUDA C/C++已成為大多數(shù)開發(fā)人員的首選解決方案。由PGI公司研發(fā)的CUDA-x86已經(jīng)發(fā)布,這意味著CUDA C/C++代碼可以運(yùn)行在基于CPU的服務(wù)器上。NVIDIA是Khronos Group的主席和積極成員之一,Khronos Group是制定新興標(biāo)準(zhǔn)OpenCL的組織。CUDA extensions與OpenCL API在設(shè)計(jì)上有很多相似之處。OpenCL API?類似于“driver API”,CUDA語言集成解決方案允許用戶只使用被稱為“CUDA Runtime API”的較高層次的抽象。CUDA C/C++是NVIDIA的創(chuàng)新平臺,它迅速推出新的特性和功能以滿足客戶的需求。

Q4:GPU計(jì)算比單獨(dú)使用CPU能夠得到怎樣的性能提升呢?

A4:這取決于映射到架構(gòu)上的問題。對于數(shù)據(jù)并行應(yīng)用、加速兩個(gè)以上mangitude命令等問題已經(jīng)得到驗(yàn)證可以有效提高計(jì)算性能?梢酝ㄟ^瀏覽CUDA技術(shù)研究、開發(fā)、應(yīng)用和合作伙伴的頁面,了解更多內(nèi)容。

Q5:CUDA支持哪些操作系統(tǒng)?

A5:CUDA支持Windows 7、Windows XP、Windows Vista、Linux和Mac OS(包括32位和64位版本)。有關(guān)CUDA支持系統(tǒng)的完整列表,請參閱最新CUDA Toolkit下載發(fā)行說明。

Q6:CUDA可以在哪些GPU上運(yùn)行?

A6:GPU計(jì)算是NVIDIA所有最新獨(dú)立顯卡的標(biāo)準(zhǔn)功能。在Supported GPUs頁面上可以找到支持CUDA的GPU的完整列表。

Q7:什么是“計(jì)算能力(compute capability)”?

A7:計(jì)算能力(compute capability)是指GPU中的計(jì)算硬件版本。

計(jì)算能力1.0對應(yīng)于最初的G80架構(gòu)。

計(jì)算能力1.1(隨后的部分G8x中引入),增加了對全局內(nèi)存原子操作(atomic operations)的支持。

計(jì)算能力1.2(GT200架構(gòu)中引入)增加了以下新功能:

●支持共享內(nèi)存中的原子函數(shù)(atomic functions)操作,以及全局內(nèi)存中的64位原子函數(shù)操作;

●支持warp vote函數(shù);

●每個(gè)多處理器(multiprocessor)有16384個(gè)寄存器;

●每個(gè)多處理器最多有32個(gè)活動warp;

●每個(gè)多處理器最多有1024個(gè)活動線程。

計(jì)算能力1.3增加了對雙精度浮點(diǎn)數(shù)的支持。

計(jì)算能力2.0(Fermi架構(gòu)中引入)增加了許多新功能,包括:

●支持并發(fā)核心執(zhí)行;

●64位尋址;

●統(tǒng)一的虛擬尋址(UVA);

●GPU Direct,點(diǎn)對點(diǎn)通信。

如果需要了解GPU及其計(jì)算能力的完整列表,請參閱最新CUDA編程指南(CUDA Programming Guide)。

Q8:并行程序設(shè)計(jì)的學(xué)習(xí)資料在哪可以找到?

A8:目前有大學(xué)的在線課程、技術(shù)網(wǎng)絡(luò)研討會和系列文章,以及有關(guān)并行計(jì)算的優(yōu)秀書籍,這些都可以在CUDA教育頁面上找到。經(jīng)常IT168 CUDA頻道,也會給CUDA學(xué)習(xí)帶來很多幫助。

在不久的將來,云計(jì)算一定會徹底走入我們的生活,有興趣入行未來前沿產(chǎn)業(yè)的朋友,可以收藏云計(jì)算,及時(shí)獲取人工智能、大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)的前沿資訊和基礎(chǔ)知識,讓我們一起攜手,引領(lǐng)人工智能的未來!

標(biāo)簽: linux 大數(shù)據(jù) 代碼 服務(wù)器 通信 網(wǎng)絡(luò) 云計(jì)算

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:在線應(yīng)用催生Scale-out存儲提升容量

下一篇:如何實(shí)現(xiàn)Hyper-V環(huán)境中的存儲管理