研究: 多核心高速計算與巨量資料分析

目前桌上型電腦,筆記型電腦,平板電腦,手機中的處理器都已經是多核心架構了,然而大家還是停留在一顆核心處理一個應用程式,如一顆核心執行上網瀏 覽器另一顆執行Microsoft Word。我們的研究是利用多顆核心一起處理一項問題,也就是平行計算(Parallel Computing)。例 如利用四顆核心一起進行一千個數字的加總:也就是每顆核心負責250個數字的加總,最後再加總即是我們要的答案。相較於以單一核心進行一千個數字的加總所 需的計算時間,理論上以四顆核心執行,我們只需花將近四分之一的時間即可。

除了目前的處理器都是多核心架構外,我們也可以將多台電腦以網路連接起來形成一個叢集系統(Cluster),如此可以利用此叢集系統中的所有電腦 同時處理一項問題。例如Google即用了數千台的叢集電腦進行搜尋服務。

目前PC的圖形加速卡,最便宜的一片只需一千多元(有些電腦甚至都已經有內建圖形加速卡),可是它卻有數百顆的核心,更讓人驚訝的是它不僅用來進行 圖形加速的工作,它也可以用來執行各種的應用程式,例如排序,矩陣相乘,最短路徑搜尋等等,應用範圍包括物理,化學,生物,財務,石油探勘,資料庫,氣象 預報,氣球科學等等。根據實測結果,相較於單一CPU核心的效能,圖形加速卡可以大幅縮短所需的執行時間,從只需十幾分之一到幾百分之一,甚至幾千分之一 的時間。這樣的運算稱為GPU運算(GPU Computing)。

隨著網路的普及與盛行,資訊量每天都以爆炸性的速度增加。因此,巨量資料分析是目前相當火紅的研究主題,而高速計算正可以縮短分析巨量資料所需的執行時間,也就是提供在合理的時間要求下,對資料進行分析並提供適切而深入的分析結果。

參考資料

什麼是 GPU 運算

GPU開啟高速計算的另一扇門

計算新趨勢 了解GPU計算和Tesla工作站

GPU高效能運算環境—CUDA與GPU Cluster介紹