平行與智慧計算實驗室

實驗室最新動態

                                         
  2022.07.05     通過 科技部計畫 「基於異質性平行分散式架構之類神經網路自動調參系統與工作排程策略之研究」  
  2021.11.25     大學部專題生-許雅竹、李奕臻、姚奕禎、耿寶宜 同學
    參加 【2021全國大專院校產學創新實作競賽 資訊與電子組】榮獲第一名  
  2021.07.15     大學部專題生-許雅竹、李奕臻、姚奕禎、耿寶宜 同學
    參加 【國立彰化師範大學智慧校園系統實作競賽 自選題目組】榮獲特優  
  2021.06.30     大學部專題生-許雅竹、李奕臻、姚奕禎、耿寶宜 同學
    參加 【109學年度國立彰化師範大學資訊工程學系大學部專題競賽暨期末專題驗收】榮獲第二名  
  2020.07.02     大學部專題生-沈俊良、曾鈜閎、劉秉澤 同學
    參加 【108學年度大學部學生專題製作競賽】榮獲第二名  
  2020.01.11     王德祥 同學 取得車輛研究測試中心獎學金  
  2019.08.25     2019年畢業生 許俊凱 畢業首份工作:北部新創公司 職稱:工程師  
  2019.07.25     2019年畢業生 劉妍芳 畢業首份工作:中山科學院 職稱:工程師  

實驗室環境與設備

< >

Read more

實驗室目前研究方向

  雖然各種神經網路已經成功地應用到許多領域,但是仍存在著許多的需求和挑戰。 要獲得一個有效的神經網路需要許多專業知識,甚至須花費相當多的搜索時間,尤其是對於需要大量測試樣本進行訓練者, 所以如何利用計算資源來進行神經網路的自動訓練也成為一個相當熱門的研究主題。 其中,以分散式系統將神經網路的架構搜尋與模型訓練平行化可以大幅降低建構神經網路的時間, 例如:2021年美國Lawrence Berkeley國家實驗室提出了適用於CPU+GPU的異質性系統。 為了因應CPU與GPU計算能力的差異,此系統可動態調整批次量大小。 但是我們發現:CPU會因為所分配到的批次量不斷縮小而造成梯度下降的準確度逐漸變低,導致系統又將學習率變低以縮小其對於整體梯度下降的影響性。 這種機制將不斷弱化CPU對於梯度下降的貢獻度。 有鑑於此以及考量如何充分應用相當普及且眾多的CPU資源,本計畫第一年主要重點是提出混合多組超參數的訓練任務進行工作排程, 讓CPU維持較大的批次量進行訓練,加快收斂的速度。 同時,我們讓部分的CPU利用非同步基因演算法動態配對訓練過的模型, 經由權重的重組,快速產生新的模型。第二年專注於自動產生CNN架構。 我們將參考數個代表性的CNN架構的核心概念,設計一個具備更多樣性的編碼方式,以基因演算法產生更好的CNN模型。 此外,讓部分CPU在架構搜尋期間,以神經演化策略協助模型訓練。 最後,計畫中所有的設計均將於U. C. Berkley所開發的Ray開源框架中實作,其可與TensorFlow及PyTorch等整合,有助於研究成果的推廣。

大學部專題研究成果:

  • 優化Tabu演算法於GPU中 (進行中)
  • 彰化師範大學圖書館K書坊之空位與占位偵測
  • 開發一具智慧分析學習成效功能之圖形化程式教學系統
  • 歷年科技部計畫

  • 111-112年 基於異質性平行分散式架構之類神經網路自動調參系統與工作排程策略之研究
  • 109-110年 支持向量機於GPU中之平行度開發研究
  • 108年 支持向量機於GPU中之平行優化研究
  • 106年 利用GPU加速大規模設施佈置之SRFLP問題
  • 104年 應用禁忌搜尋法以解決流線式生產排列問題之GPU平行化研究
  • 103年 BLASTP在圖形加速器中平行計算之最佳化研究
  • 102年 生物資訊演算法在GPU高速執行之研究
  • 101年 動態規劃演算法於圖形處理器中平行執行之最佳化研究
  • 099年 CLIPS專家系統語言之平行化研究
  • 098年 平行CLIPS語言及其解譯器中自我排程策略之設計
  • 095年 改善單核心超純量處理器執行效能之研究
  • 094年 單晶片多處理機中改善記憶體存取效能之研究
  • 093年 一個適用於雙重執行模式單晶片多處理機架構之處理單元分派策略之研究
  • 092年 具雙重執行模式之單晶片多處理機之研究
  • 092年 2003年IEEE太平洋地區通訊,電腦與訊號處理研討會
  • 090年 單晶片多處理機設計之研究
  • 歷年科技部大專生計畫

  • 111年 應用二維條碼於圖書館館藏清點暨智慧上架之管理系統 (進行中)
  •    圖書館自習室常發生無法掌握座位使用狀況與不當占位現象。某些圖書館會 利用座位預約系統配合門禁刷卡,來掌握座位的使用人數,但該方法仍無法有效 解決物品占位的情況。因此本研究在圖書館既有環境運作條件下,利用多部監視 器的即時影像,開發出一套智慧監控自習室座位使用與占位系統。另外在本系統 中,需要克服座位上有隔板遮擋使用者的問題。並且在結果呈現的方式,需要保 障使用者隱私權以及提供使用者方便查看的服務。為發展本座位管理系統具有人 形辨識、辨識準確率、使用者行動軌跡以及占位現象辨識等多項功能,本研究運 用到YOLO 辨識技術、物體追蹤、Canny 邊緣檢測與網頁等方法。研究結果顯 示,本研究所開發的座位管理系統涵蓋:(1)判斷有無使用者正在使用的座位狀態, (2)判斷有無使用物品占用的座位狀態,(3)在網頁即時呈現座位狀態與LINE 訊 息通知占位者等功能。

       本計畫以Google Blockly 作為圖像化程式設計軟體的基礎,以教學內容為 主體設計程式內容,使用利於國中小學生理解的用語及方便資訊教師自行擴充 的介面,並結合使用者的帳戶管理與雲端程式備份及查閱,方便教師以清楚的 介面調閱學生的程式紀錄,同時使用雲端記錄重現學生操作時的行為,對於理 解學生於程式方面的觀念能有更好的效果,學生能於自己的介面讀取過往的程 式紀錄,解決以往在課堂間保存上的不便。 除此之外,將學生操作上的數據收集之後,以機器學習的方法分析,以決策 樹演算法找到學生於編寫程式時所發生的觀念問題,在課堂教學中,教師若要 找出學生觀念上問題,往往耗費大量心力,因此藉由此方法分析學生操作時觀 念上的錯誤,方便教師理解學生之學習問題所在。 在本次計畫中,我們設計出一款具備視覺化程式設計介面、課堂導向之雲端 系統、快速擴充程式方塊介面、程式作業自動評分、機器學習判斷錯誤模式等 功能之完整程式。 以上的功能將協助師生雙方在學習上的效率,學生不必在各個課堂間辛苦尋 找自己的檔案或是為了沒有備份而懊惱,教師也可以透過時光機、自動評分、 判斷錯誤模式等功能快速釐清學生問題癥結點,有效率的批改作業,以及利用 機器學習協助教學進展。 本計畫之機器學習功能受限於結案時軟體尚未用於實際課堂,用於機器學習 之訓練集與測試集十分缺乏,導致最後訓練出的模組不夠精確,也不能完美符 合實際上會發生的錯誤,這些問題希望能在軟體正式上線時可以利用更大量的 資料以增進精確度。

       Canny 測邊器被廣泛使用在數位影 像處理演算法的前處理階段,因在測邊品 質方面,其具有相當好的真實邊緣偵測能 力[1]。而近年來由於GPU 的架構特性, 使其可以獲得比CPU 快上許多倍的執行效 能增益。有鑑於此,我們將探討如何利用 GPU 的架構特性,設計Canny 測邊演算法 之平行演算法,本計畫改善了先前論文在 圖像像素於全域記憶體的讀取、卷積運算 的Loop Unrolling、並針對先前論文中邊 緣優化的步驟加以比較,以設計出效能較 佳的Canny 數位影像測邊器。

       進年來,有越來越多的研究探討如何處理由多核電腦組成的叢集式系統所面 臨的異質性問題。過去我們曾為這種異質性叢集式系統提出混合MPI 與OpenMP 的Loop Self-scheduling 模型;許多知名的排程方式都經修改以達更佳效能。儘 管過去所提出的分層式自我排程機制(Layer Self-scheduling, LSS)模型能運用 OpenMP 在從屬節點端開發出執行緒層面的平行度,並搭配叢集式系統的異質性 採取依據效能的工作分配策略,成功提高系統產能,但主節點上的執行緒層平行 度並未被考慮;主節點僅單一核心被使用到,是為系統資源的浪費。為了善用系 統資源,如何讓主節點的閒置核心以多執行緒方式協助運算、當這些核心參與運 算時,如何妥善分割資料給主節點與從屬節點以縮短執行時間,便成為重要的議 題。此外,採用依據效能的工作分配(Performance-based)策略,往往也因應用程 式的性質不同而易發生排程過程中工作量過多或過少的極端,進而影響執行時 間。因此在本計畫中,我們將探究、解決LSS 模型的問題,提出强化版的分層 式自我排程機制(Enhanced Layer Self-scheduling, ELSS)模型。ELSS 模型以 OpenMP 共享式記憶體的平行方式讓主節點上的執行緒參與運算,並解決依據效 能的工作分配策略會面臨的資料分配問題,讓主節點能更聰明地指派適當工作量 給從屬節點。最後,我們以矩陣相乘、蒙地卡羅積分、曼德勃羅集合計算等三組 應用程式測試我們的ELSS 模型,分別獲得達1.7、13、2.7 的效能增益。

  • 參考資料