站長資訊平臺

Python并行處理

2018-07-20 來源：編程學習網(wǎng)

簡介

當你在機器上啟動某個程序時，它只是在自己的“bubble”里面運行，這個氣泡的作用就是用來將同一時刻運行的所有程序進行分離。這個“bubble”也可以稱之為進程，包含了管理該程序調(diào)用所需要的一切。

例如，這個所謂的進程環(huán)境包括該進程使用的內(nèi)存頁，處理該進程打開的文件，用戶和組的訪問權(quán)限，以及它的整個命令行調(diào)用，包括給定的參數(shù)。

此信息保存在UNIX/Linux系統(tǒng)的流程文件系統(tǒng)中，該系統(tǒng)是一個虛擬文件系統(tǒng)，可通過 /proc 目錄進行訪問。條目都已經(jīng)根據(jù)進程ID排過序了，該ID是每個進程的唯一標識符。示例1顯示了具有進程ID#177的任意選擇的進程。

示例1:可用于進程的信息

構(gòu)建程序代碼以及數(shù)據(jù)

程序越復雜，就越有助于將其分成較小的模塊。不僅僅源代碼是這樣，在機器上執(zhí)行的代碼也同樣適用于這條規(guī)則。該規(guī)則的典型范例就是使用子進程并行執(zhí)行。這背后的想法就是：

單個進程包含了可以單獨運行的代碼段
某些代碼段可以同時運行，因此原則上允許并行
使用現(xiàn)代處理器和操作系統(tǒng)的特性，例如可以使用處理器的所有核心，這樣就可以減少程序的總執(zhí)行時間
減少程序/代碼的復雜性，并將工作外包專門的代理

使用子進程需要重新考慮程序的執(zhí)行方式，從線性到并行。它類似于將公司的工作視角從普通員工轉(zhuǎn)變?yōu)榻?jīng)理——你必須關(guān)注誰在做什么，某個步驟需要多長時間，以及中間結(jié)果之間的依賴關(guān)系。

這有利于將代碼分割成更小的部分，這些更小的部分可以由專門用于此任務的代理執(zhí)行。如果還沒有想清楚，試想一下數(shù)據(jù)集的構(gòu)造原理，它也是同樣的道理，這樣就可以由單個代理進行有效的處理。但是這也引出了一些問題：

為什么要將代碼并行化?落實到具體案例中或者在努力的過程中，思考這個問題有意義嗎?
程序是否打算只運行一次，還是會定期運行在類似的數(shù)據(jù)集上?
能把算法分成幾個單獨的執(zhí)行步驟嗎?
數(shù)據(jù)是否允許并行化?如果不允許，那么數(shù)據(jù)組織將以何種方式進行調(diào)整?
計算的中間結(jié)果是否相互依賴?
需要對硬件進行調(diào)整嗎?
在硬件或算法中是否存在瓶頸，如何避免或者最小化這些因素的影響?
并行化的其他副作用有哪些?

可能的用例就是主進程，以及后臺運行的等待被激活的守護進程(主/從)。此外，這可能是啟動按需運行的工作進程的一個主要過程。在實踐中，主要的過程是一個饋線過程，它控制兩個或多個被饋送數(shù)據(jù)部分的代理，并在給定的部分進行計算。

請記住，由于操作系統(tǒng)所需要的子進程的開銷，并行操作既昂貴又耗時。與以線性方式運行兩個或多個任務相比，在并行的情況下，根據(jù)您的用例，可以在每個子過程中節(jié)省25%到30%的時間。例如，如果在系列中執(zhí)行了兩項消耗5秒的任務，那么總共需要10秒的時間，并且在并行化的情況下，在多核機器上平均需要8秒。有3秒是用于各種開銷，即這部分是無法壓縮和優(yōu)化的，所以速度提高是有極限的。

運行與Python并行的函數(shù)

Python提供了四種可能的處理方式。首先可以使用 multiprocessing 模塊并行執(zhí)行功能。第二，進程的替代方法是線程。從技術(shù)上講，這些都是輕量級的進程，不在本文的范圍之內(nèi)。想了解更加詳細的內(nèi)容，可以看看Python的線程模塊。第三，可以使用 os 模塊的 system() 方法或 subprocess 模塊提供的方法調(diào)用外部程序，然后收集結(jié)果。

multiprocessing 模塊涵蓋了一系列方法來處理并行執(zhí)行例程。這包括進程，代理池，隊列以及管道。

清單1 使用了五個代理程序池，同時處理三個值的塊。對于代理的數(shù)量和對 chunksize 的值都是任意選擇的，用于演示目的。根據(jù)處理器中核心的數(shù)量來調(diào)整這些值。

Pool.map() 方法需要三個參數(shù) - 在數(shù)據(jù)集的每個元素上調(diào)用的函數(shù)，數(shù)據(jù)集本身和 chunksize 。在清單1中，我們使用 square 函數(shù)，并計算給定整數(shù)值的平方。此外， chunksize 不是必須的。如果未明確設置，則默認 chunksize 為1。

請注意，代理商的執(zhí)行訂單不能保證，但結(jié)果集的順序是正確的。它根據(jù)原始數(shù)據(jù)集的元素的順序包含平方值。

清單1：并行運行函數(shù)

運行此代碼應該產(chǎn)生以下輸出：

注意：我們將使用Python 3作為這些例子。

使用隊列運行多個函數(shù)

作為數(shù)據(jù)結(jié)構(gòu)，隊列是非常普遍的，并且以多種方式存在。它被組織為先進先出（FIFO）或先進先出（LIFO）/ 堆棧，以及有和沒有優(yōu)先級（優(yōu)先級隊列）。數(shù)據(jù)結(jié)構(gòu)被實現(xiàn)為具有固定數(shù)量條目的數(shù)組，或作為包含可變數(shù)量的單個元素的列表。

在 列表2.1-2.7 中，我們使用FIFO隊列。它被實現(xiàn)為已經(jīng)由來自 multiprocessing 模塊的相應類提供的列表。此外， time 模塊被加載并用于模擬工作負載。

清單2.1：要使用的模塊

接下來，定義一個worker函數(shù)（ 清單2.2 ）。該函數(shù)實際上代表代理，需要三個參數(shù)。進程名稱指示它是哪個進程， tasks 和 results 都指向相應的隊列。

在工作函數(shù)里面是一個 while 循環(huán)。 tasks 和 results 都是在主程序中定義的隊列。 tasks.get() 從要處理的任務隊列中返回當前任務。小于0的任務值退出 while 循環(huán)，返回值為-1。任何其他任務值都將執(zhí)行一個計算（平方），并返回此值。將值返回到主程序?qū)崿F(xiàn)為 result.put() 。這將在 results 隊列的末尾添加計算值。

清單2.2：worker函數(shù)

下一步是主循環(huán)（參見 清單2.3 ）。首先，定義了進程間通信（IPC）的經(jīng)理。接下來，添加兩個隊列，一個保留任務，另一個用于結(jié)果。

清單2.3：IPC和隊列

完成此設置后，我們定義一個具有四個工作進程（代理）的進程池。我們使用類 multiprocessing.Pool() ，并創(chuàng)建一個它的實例。接下來，我們定義一個空的進程列表（ 見清單2.4 ）。

清單2.4：定義一個進程池

作為以下步驟，我們啟動了四個工作進程（代理）。為了簡單起見，它們被命名為“P0”到“P3”。使用 multiprocessing.Pool() 完成創(chuàng)建四個工作進程。這將它們中的每一個連接到worker功能以及任務和結(jié)果隊列。最后，我們在進程列表的末尾添加新初始化的進程，并使用 new_process.start() 啟動新進程（參見 清單2.5 ）。

清單2.5：準備worker進程

我們的工作進程正在等待工作。我們定義一個任務列表，在我們的例子中是任意選擇的整數(shù)。這些值將使用 tasks.put() 添加到任務列表中。每個工作進程等待任務，并從任務列表中選擇下一個可用任務。這由隊列本身處理（見 清單2.6 ）。

清單2.6：準備任務隊列

過了一會兒，我們希望我們的代理完成。每個工作進程對值為-1的任務做出反應。它將此值解釋為終止信號，此后死亡。這就是為什么我們在任務隊列中放置盡可能多的-1，因為我們有進程運行。在死機之前，終止的進程會在結(jié)果隊列中放置-1。這意味著是代理正在終止的主循環(huán)的確認信號。

在主循環(huán)中，我們從該隊列讀取，并計數(shù)-1。一旦我們計算了我們有過程的終止確認數(shù)量，主循環(huán)就會退出。否則，我們從隊列中輸出計算結(jié)果。

清單2.7：結(jié)果的終止和輸出

示例2 顯示了Python程序的輸出。運行程序不止一次，您可能會注意到，工作進程啟動的順序與從隊列中選擇任務的進程本身不可預測。但是，一旦完成結(jié)果隊列的元素的順序與任務隊列的元素的順序相匹配。

示例2

注意：如前所述，由于執(zhí)行順序不可預測，您的輸出可能與上面顯示的輸出不一致。

使用os.system()方法

system() 方法是 os模塊的一部分，它允許在與Python程序的單獨進程中執(zhí)行外部命令行程序。 system() 方法是一個阻塞調(diào)用，你必須等到調(diào)用完成并返回。作為UNIX / Linux拜物教徒，您知道可以在后臺運行命令，并將計算結(jié)果寫入重定向到這樣的文件的輸出流（參見 示例3 ）：

示例3：帶有輸出重定向的命令

在Python程序中，您只需簡單地封裝此調(diào)用，如下所示：

清單3：使用os模塊進行簡單的系統(tǒng)調(diào)用

此系統(tǒng)調(diào)用創(chuàng)建一個與當前Python程序并行運行的進程。獲取結(jié)果可能會變得有點棘手，因為這個調(diào)用可能會在你的Python程序結(jié)束后終止 - 你永遠都不會知道。

使用這種方法比我描述的先前方法要貴得多。首先，開銷要大得多（進程切換），其次，它將數(shù)據(jù)寫入物理內(nèi)存，比如一個需要更長時間的磁盤。雖然這是一個更好的選擇，你的內(nèi)存有限（像RAM），而是可以將大量輸出數(shù)據(jù)寫入固態(tài)磁盤。

使用子進程模塊

該模塊旨在替換 os.system() 和 os.spawn() 調(diào)用。子過程的想法是簡化產(chǎn)卵過程，通過管道和信號與他們進行通信，并收集他們生成的輸出包括錯誤消息。

從Python 3.5開始，子進程包含方法 subprocess.run() 來啟動一個外部命令，它是底層 subprocess.Popen() 類的包裝器。作為示例，我們啟動UNIX/Linux命令 df -h ，以查找機器的 / home 分區(qū)上仍然有多少磁盤空間。在Python程序中，您可以執(zhí)行如下所示的調(diào)用（ 清單4 ）。

清單4：運行外部命令的基本示例

這是基本的調(diào)用，非常類似于在終端中執(zhí)行的命令 df -h / home 。請注意，參數(shù)被分隔為列表而不是單個字符串。輸出將與示例4相似。與此模塊的官方Python文檔相比，除了調(diào)用的返回值之外，它將調(diào)用結(jié)果輸出到 stdout 。

示例4 顯示了我們的呼叫的輸出。輸出的最后一行顯示命令的成功執(zhí)行。調(diào)用 subprocess.run() 返回一個類 CompletedProcess 的實例，它有兩個名為 args （命令行參數(shù)）的屬性和 returncode （命令的返回值）。

示例4：運行清單4中的Python腳本

要抑制輸出到 stdout ，并捕獲輸出和返回值進行進一步的評估， subprocess.run() 的調(diào)用必須稍作修改。沒有進一步修改， subprocess.run() 將執(zhí)行的命令的輸出發(fā)送到 stdout ，這是底層Python進程的輸出通道。要獲取輸出，我們必須更改此值，并將輸出通道設置為預定義值 subprocess.PIPE 。清單5顯示了如何做到這一點。

清單5：抓取管道中的輸出

如前所述， subprocess.run() 返回一個類 CompletedProcess 的實例。在清單5中，這個實例是一個簡單命名為 output 的變量。該命令的返回碼保存在屬性 output.returncode 中，打印到 stdout 的輸出可以在屬性 output.stdout 中找到。請注意，這不包括處理錯誤消息，因為我們沒有更改輸出渠道。