資料與運算科技日新月異,促成各行各業的人工智慧(Artificial Intelligence, AI)數據建模突破,承此,數據模型開發過程中如何分析及運用大量數據就成了重要關鍵。2022年10月到11月間,由明志科技大學人工智慧暨資料科學研究中心(簡稱AI中心)舉辦了為期9天的『AI運用實戰工作坊』,由AI中心前主任鄒慶士教授蒞臨授課。鄒教授為國立臺北商業大學資訊與決策科學研究所專任教師,曾任本校AI中心主任、機械工程系特聘教授,參與過的AI專案包括氣象、交通、互聯網、電子商務、金融科技、計量化學、智慧養殖、綠能發電、環境輻射、生醫器材、化工製程等領域,並有工程機率統計、資料探勘、機器學習及人工智慧等實作課程多年的教學經驗,為臺灣目前資料科學/大數據人工智慧產業應用工作重要推動者之一,致力於「做中學、學中做」的理論與實務兼備之資料科學人才培育志業。
本次工作坊參與對象為台塑集團各事業體旗下公司30多名AI專責人員,計劃名稱為「統計與迴歸分析實務培訓計畫 – 以化學計量學及化工產業為焦點」,內容包括「統計分析基礎實戰班」與「多元迴歸分析實戰班」兩個連貫的系列課程,全程運用開放源碼的分析建模環境進行實機操作。培訓目標在協助學員掌握化學、化工、及其它相關類型數據的特質,明瞭不同前處理與建模方法的異同,並活用第四代程式語言Python的智慧資料分析建模函式庫,邁向開源分析建模軟體逐夢踏實之康莊大道。
培訓的系列課程準備了製造業實務案例資料,從數據的理解及清理開始,進入特徵提取與選擇,再利用機率統計學習(probabilistic & statistical learning)建立與評估模型,最終進行分類、集群、預測、診斷與決策等應用。數據的理解須由物理、化學、生物等領域基礎知識開始,接著運用數學及計算機模型,探索與分析化學計量學與化工/生化領域的資料集,完整進行資料導向程式設計(data-driven programming)的預測建模,除了深入淺出的理論說明與案例實作,並分享講師在數據探索與分析建模上的實戰經驗。引領學員們邁向『數據取其重,解析是王道』的成功之路,掌握資料科學支撐起AI預測建模能落地應用的關鍵,讓參訓學員成為台塑各部門中AI專案實際應用的關鍵種子。
本文同時刊載於明志電子報第125期。