帳號:
密碼:
CTIMES / 文章 /   
人工智慧技術發展
 

【作者: 廖俊威】   2020年02月12日 星期三

瀏覽人次:【770】
  

近年來人工智慧(Artificial Intelligence, AI)技術快速發展,越來越多企業想引入AI技術至生產線以及服務上,期望能讓機器取代人力以節省人力成本,甚至是做出更加精確之決策,改善使用者體驗,而在學術界AI技術也是熱門的研究議題之一,眾多學者提出適應不同情境的模型,與更加快速的訓練方式,使得AI成為未來最具發展性的技術之一。


人工智慧簡介

人工智慧最早可以追溯回1950年代,當時主要應用在棋盤遊戲上,隨著理論與硬體的發展,AI可使用的領域越來越廣,在特定領域中甚至比人類表現得更加優秀。


在過去人們解決問題往往依賴各式各樣的演算法,使用邏輯推理得出不同問題的最佳解,然而傳統演算法的設計需要經過層層的推理與驗證,才能確保得出的答案正確無誤,這嚴謹的過程導致傳統演算法設計十分困難與費時,然而AI卻以不同的角度來解決問題。對於AI而言,只重視最後得出來的答案是否正確,良好的訓練資料越多,回答的正確率就越高,由於這樣的特性使得同一個AI演算法能應用在眾多領域。


人工智慧發展狀況

人工智慧的技術不論在學術界還是產業界皆受到重視,在學術界越來越多學者投入AI的研究中,近年來與AI相關的論文越來越多,各大研討會與期刊也陸續將AI作為一個獨立的主題進行徵稿,突顯了AI在學術領域的重要性。



圖一 : AI研討會列表
圖一 : AI研討會列表

除了在學術界有許多與人工智慧相關的研討會外,在產業界也出現眾多以AI為主打的產品,舉凡智慧音箱、智能家電、車牌辨識系統等,在生活中不時可以見到與AI相關的應用,除了改善生活品質外,也減少了許多人力的消耗。



圖二 : 結合人工智慧之產品
圖二 : 結合人工智慧之產品

http://smartliving.tatung.com.tw/ricecooker/index.html)


人工智慧能應用在很多領域,其中以影像相關應用表現得最好,舉凡人臉識別、軌跡預測、智慧採果機、AOI系統等,皆是已實現之應用。利用AI處理影像的技術被稱之為電腦視覺(Computer vision),藉由訓練模型來讓電腦「看得懂」影像的內容,並根據不同的內容做出不同的行為。


相對於文字資料,影像資料中包含更多的資訊,使得AI模型在訓練時能有更多的參考資料,讓AI在實戰時有更好的表現,另一方面,在AI技術出現前已有成熟的影像處理演算法,為後續電腦視覺的發展奠定了良好基礎,結合傳統演算法與AI技術,能更加精確的處理影像相關應用。


提到人工智慧在影像中的應用勢必讓人聯想到ImageNet,ImageNet專案是一個大型視覺資料庫,其中有上千萬張已標記過的影像提供研究使用,該專案在每年會舉辦一次競賽,辨識不同的場景與圖中物件,現今有許多AI影像應用所使用的模型結構皆來自於該競賽,同時許多訓練好的模型也被釋出,不僅促進學術研究與產業開發,還加速了AI技術在影像的發展。



圖三 : ImageNet
圖三 : ImageNet

人工智慧優勢與限制

相較於傳統演算法,人工智慧有較大的彈性,AI重視所得出的結果而不重視過程,同時允許一定程度的誤差,當人們試著去解釋AI是如何做出決策時,發現模型中的參數難以解釋,由於模型中各項參數調整是基於複雜的數學運算,根據訓練資料一步步更新模型參數,讓輸出的答案與正確答案越來越相近,因此AI模型曾被戲稱為「黑盒子」,但這並不影響AI技術的重要性。


傳統演算法需針對不同的問題來設計不同的演算法,但其中有一些難題無法在多項式時間內被解出,使得傳統演算法在設計上面臨困難,但AI技術的設計相對單純,只針對輸入與輸出進行對應,當有越多筆測試資料可供訓練,AI的表現就會越好,根據許多研究者的經驗,只要有足夠多的正確資料,AI在任何領域皆能表現得不錯。


人工智慧擁有很多優點,但也有其相對限制,由於AI只專注於所得答案之正確性,因此當訓練資料不夠時往往表現不佳,而訓練資料也有品質上的限制,若所蒐集到的訓練資料包含太多錯誤訊息,AI同樣無法有良好表現。另一方面因為資料的限制,AI在不易蒐集到資料的領域難以實現,例如戰爭預測、疾病爆發等,AI皆無法有良好的表現。


AI技術主要包含資料處理與模型訓練兩大部分,實際操作流程大致區分為:


(1)根據應用環境收集資料;


(2)依照背景知識對資料進行處理,包含資料正規化、去除不合理之資料等,並切割成訓練資料與驗證資料;


(3)依照不同應用環境決定使用的模型;


(4)將訓練資料輸入模型當中進行訓練;


(5)將驗證資料輸入訓練完成的模型中,確認模型能得出符合期望的答案;


(6)若通過驗證則結束流程,若驗證不通過或表現不理想,則重新收集資料或重新選擇使用的模型。


AI模型表現不佳時,問題常出現在資料集與模型選擇上,有時是因為所收集的資料量不足,讓模型無法確實學習出正確的決策方法,有時則是因為所選擇的模型結構不適合資料,導致即使有良好品質的資料,模型也無法有良好表現。


資料與模型的挑選並沒有明確的公式可供參考,只能憑著經驗去挑選,為了滿足挑選模型的問題,AI開源套件Scikit-learn提供了一個簡易的模型挑選原則(圖四),讓開發者可以快速找出適合的模型。



圖四 : Scikit-learn模型挑選
圖四 : Scikit-learn模型挑選

常使用到的開發工具

人工智慧的技術包含了許多複雜的數學計算,在開發時往往會使用到許多開源套件,減少撰寫程式時的負擔,在眾多開發套件中最知名的為TensorFlow與Keras,兩者皆提供了許多建立模型時所需使用的功能,讓開發者能快速修改及建立模型,同時還有多種訓練過的模型可供下載。



圖五 : TensorFLow
圖五 : TensorFLow

圖六 : Keras
圖六 : Keras

開發工具的出現讓模型的設計變得簡單,在過去建立模型前除了了解其背後原理外,還需要龐大的數學知識支撐,才能撰寫出一個可以正常運行的模型,而在運算效率上除了軟體還需要硬體的配合,AI技術能發展一部分歸功於GPU的出現,加速了神經網路的計算,讓曾經被冷落的AI技術再次受到世人重視。


隨著越來越多開發套件與硬體的出現,不僅讓開發者更容易進行開發,同時也降低了進入AI領域的門檻,讓更多對AI感興趣的人加入開發行列,使得AI技術快速進步,成為未來最受矚目且具發展性的技術之一。


範例介紹--人臉識別

人工智慧能使用在眾多應用之中,以影像相關應用為例,人臉識別是一項熱門的應用,可使用在公司行號上班打卡、會員身分判別、身分比對等許多情境,讓使用者可以使用「刷臉」的方式更加快速完成驗證, 以下將介紹簡易的人臉識別實作流程。


資料收集

首先要先收集欲進行辨識之人的照片,根據人數不同每人所需要的張數也不同,想判斷的人數越多每人所需的張數就越多,本案例以三位明星為例,每人收集50張照片當作訓練資料,另外再蒐集50張照片當作驗證資料



圖七 : 資料收集 (source:blogs.icrc.org)
圖七 : 資料收集 (source:blogs.icrc.org)

資料前處理

由於收集到的照片品質不一,有些包含太多無用資訊,為了避免在訓練時受到干擾,需先對每張照片進行處理,使用face_recognition工具擷取出人臉位置,並將不同人的照片編上不同的號碼,加速模型的訓練。



圖八 : 資料前處理(source:breakingolds.com)
圖八 : 資料前處理(source:breakingolds.com)

模型挑選與訓練

有了處理完畢的資料集後便可以選擇想要使用的模型,在本範例中選擇使用ResNet的結構,並引入Keras套件中預訓練完成參數進行遷移式學習(Transfer Learning),將模型修改成符合需求的結構,並進行訓練。



圖九 : 模型挑選(source:凌?)
圖九 : 模型挑選(source:凌?)

驗證結果

將訓練好的模型使用驗證資料進行測試,確認正確率符合預期,若表現不佳則須重新訓練模型或再次修改模型結構,直至正確率高過一定水平。



圖十 : 驗證結果(source:xenonstack.com)
圖十 : 驗證結果(source:xenonstack.com)

本範例簡易介紹人臉識別的實驗流程,在實際應用情況當中仍有許多需要考慮的細節,像是個人照片的提供、拍攝時的場景變化、辨識精準度之閥值設定等,許多細項需要做考量,因此人臉識別在實現過程中仍有一定的難度,需要細心及耐心的處理。


結論

人工智慧的出現帶給人們生活很大的影響,許多事情不必再由人類自行處理,隨著軟硬體的進步,AI能辦到的事情越來越多,在社會上甚至出現了AI最終將取代人類的言論,反對AI技術發展,但不可否認的是AI技術帶給人們很大的方便。


從學術界的角度來看,越來越多學者在進行AI相關研究,以AI為主題的論文也越來越多,成為學術界中主流研究之一。以產業界的角度來看,各大廠商紛紛將AI結合至自家產品之中,出現了許多智慧家電、智能分析系統等,


與AI相關的應用,比起一般的產品,消費者也更加願意選擇擁有更多功能的「智能產品」。


綜合產學界的角度來看,人工智慧不論在技術還是應用上皆有很大的發展空間,隨著越多人的投入,發展必定更加快速,在未來人工智慧必定會是最主要的趨勢之一。


(本文作者廖俊威為凌群電腦軟體工程師)


參考資料

[1] “Top Conferences for Machine Learning & Arti. Intelligence,” http://www.guide2research.com/topconf/machine-learning


[2] “ImageNet,” http://www.image-net.org/


[3] “TensorFlow,” https://www.tensorflow.org/


[4] “Keras,” https://keras.io/


相關文章
工業自動化強勢來襲 運動控制扮演關鍵要角
加速數據處理 讓人們的生活更美好
TrendForce解析2020年十大科技趨勢
《Fjord趨勢2020》報告
AI,加速運算推動個人化醫療轉型
comments powered by Disqus
相關討論
  相關新品
EM500EV 測試/開發板
原廠/品牌:集博
供應商:集博
產品類別:IDE
  相關新聞
» 達梭系統3DEXPERIENCE World 2020 號召創新者共造設計世界
» 智慧醫療產業前瞻 貿協揭開醫材應用新商機
» 國衛院、長庚醫、宏碁三方結盟 肥胖症智慧預測系統計畫啟動
» 群策群力建構推展精準健康照護體系
» 仁大資訊Booster5讓小店家也能做在地行銷
  相關產品
» TYAN發佈伺服器及主機板支援第二代Intel Xeon
» 意法半導體推出採用Linux發行版的STM32MP1微處理器
» NVIDIA宣布推出Jetson Nano係可運行所有AI模組的CUDA-X AI電腦
» 德承推出DC-1200:採用Intel Pentium N4200的緊湊型無風扇電腦
» 大聯大品佳集團推出240W電競筆記型電腦變壓器解決方案

AD


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2020 遠播資訊股份有限公司版權所有 Powered by O3
地址:台北市中山北路三段29號11樓 / 電話 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw