:::
科技新知
生成式AI在製造領域應用展望
發表日期:2023-07-19
作者:熊治民(工研院)
摘要:
生成式人工智慧(Generative AI,簡稱生成式AI)與鑑別式人工智慧(Discriminative AI,簡稱鑑別式AI),都是基於機器學習的重要人工智慧技術。
全文:
一、生成式AI特性與應用效益
(一)生成式與鑑別式人工智慧
生成式人工智慧(Generative AI,簡稱生成式AI)與鑑別式人工智慧(Discriminative AI,簡稱鑑別式AI),都是基於機器學習的重要人工智慧技術。
鑑別式AI可以透過有標註資料學習訓練,對輸入資料進行辨識、分類。這類AI方案目前已經大量應用在許多領域;例如人臉、車牌辨識,產品瑕疵辨識與分類,人員及場域環境安全辨識與警示,人體病徵辨識等。
相對於以辨識、分類為主的鑑別式AI,生成式AI則可以透過大量資料學習訓練,依據輸入資料,自主產生新的資料內容。輸入與輸出資料類型可包括文字、語音、圖像、影像、程式碼、3D模型數據等。
目前生成式AI模型建構,主要方式之一是透過Generative Pre-trained Transformer(簡稱GPT)方式,利用極大量的非標註、非結構化資料與自監督式學習(Self-Supervised Learning)過程進行訓練,然後建構出基礎模型(Foundation model)。這類基礎模型可以依據輸入資料,自動產生出一段新的內容。例如目前十分熱門的ChatGPT,可以依據使用者輸入的文字提示,回答問題或產生一段文章、一份文案。
不過這種基礎模型,對於較專業的問題,可能無法提出令人滿意的答案。這時可以再透過少量人工標記資料,對基礎模型進行更專門的學習訓練,調適(Finetune)成客製化模型。這些客製化模型可用於更專門的領域,例如繪圖、設計、機器人控制等。
(二)生成式AI應用效益
無論是生成式AI或鑑別式AI,其應用效益都包含自動化、高速化與準確性(相對於特定人員作業結果)。例如鑑別式AI,結合自動光學檢測(AOI),讓製造業者能提高零組件與產品自動化檢測速度與準確性,進而降低人力需求與誤判率。
生成式AI應用同樣具備自動化、高速與準確性等效益。以ChatGPT為例,其功能包含:立即式問答與回應;對相關資料內容自動提出文字摘要;依據輸入提示,自動產生文章、文案、程式碼、設計方案、圖形或影像。
因此像ChatGPT這類生成式AI,具體應用與效益包括:
- 作為更智慧化的人機介面;例如更快速、正確理解使用者發出的自然語言並進行回應。
- 協助創作者更快速產生文字、音樂、圖像、影音等數位內容;特別是在創作初期,能依據較少的提示,快速產生具可用性的初稿。
- 依據提示快速產生程式碼,協助程式設計師提高軟體建構速度與效能。
- 協助知識工作者,對特定議題內容進行快速彙整、產生重點摘要;提高後續編輯、分析工作效能。
不過生成式AI仍處於持續發展階段,無論是系統本身或在使用上,仍有許多限制與挑戰需要克服。包括:
- 用於訓練基礎模型的資料內容,對於生成式AI能力有很大影響。即使有大量的資料,像ChatGPT在回答題提問、產生具體內容時,仍可能出現邏輯或常識方面的錯誤。部分研究團隊與使用者也擔心,如果用來訓練基礎模型的資料中,有部分存在文化、意識等方面的偏見,也可能導致生成內容出現問題。
- 目前生成式AI基礎模型所產生的結果(例如資料分析、產品設計結果),無法確保完全的真實性與可實施性,仍必須由使用者做進一步的判別、調整,才能獲得具實用性的結果。如果要提高生成式AI產出的可用性,還需要結合專門領域資料及訓練過程,並透過在系統使用時針對生成內容持續回饋(透過人工或自動程序)及更新專業資料,才能提高生成式AI在專業領域的實用性。
- 建構基礎模型需要耗費大量人力、時間,同時生成式AI在使用上也需要仰賴大量的運算資源;這些都需要極高的成本投入。未來如果要擴大生成式AI應用,除了持續提升系統功能,也需要有合適的商業模式相配合。
- 在理論上,生成式AI模型如果能透過吸收新資料進行學習,可以持續提升運作效能。但是在實務上,則可能涉及使用者本身資訊保護與新生成資料的智慧財產權歸屬問題。因此已有部分公司為防止資料外洩,禁止員工使用生成式AI處理工作。這些問題仍需要進一步從技術與法規層面探索可行的解決方法。
二、生成式AI在製造領域應用潛力
相對於鑑別式AI已廣泛應用在製造場域,生成式AI在製造領域的應用模式與價值,仍需要持續探索與驗證。工研院機械與機電系統研究所饒達仁所長在一場研討會中指出,生成式AI在製造領域的潛在應用場景包括:
- 協助工廠教育訓練,生成教育訓練手冊,及訓練後的問答過程。
- 生成操作與作業流程。
- 協助異常事件處理,生成維修或調整機制。
- 客服機器人,於第一線服務客戶。
- 輔助程式碼編寫。
- 加速資料檢索或刺激腦力激盪新想法。
- 智慧機械設計/語意溝通,快速有效的提供機構設計方法。
依據工研院產科國際所ITIS研究團隊觀察,生成式AI在製造場域的主要潛在應用可區分為幾類:市場與產品需求探索,創新產品設計,控制程式自動生成,知識管理與人員作業協助,智慧化人機介面。以下分別進行說明。
(一)市場與產品需求探索
如何發掘新市場機會與確認目標客戶需求,是企業在市場開發與新產品研發過程中面臨的關鍵問題。大多數企業通常會通過市調、問卷等途徑來進行新市場評估與客戶需求探索;但是這會耗費相當的時間、人力資源與資金成本。未來則可利用生成式AI,依據設定目標,從廣泛的社交媒體、新聞資訊等數位內容中,快速限縮客戶消費趨勢變化與需求缺口研析範圍,甚至提供具體的探索方向。這可以縮短新市場與產品需求探索時間,減少人力與資金投入。
(二)創新產品設計
產品創新設計是製造業爭取客戶與開發市場的重要工作。優秀且具有市場競爭力的新產品設計,需要仰賴研發設計團隊的持續努力,除了工程能力外,也需要能迎合消費者喜好,或是透過融合新趨勢來帶動新潮流。生成式AI因為可以透過適當的提示與引導,快速生成新內容,因此相當適合用來協助進行產品設計。
例如國際知名家具業者IKEA旗下的未來創新實驗團隊SPACE10,以IKEA公司過去的家具型錄作為資料,訓練AI模型來生成具有1970、80年代復古風格的新家具設計。不過由AI設計的家具,還無法兼顧到工程知識,因此部分創新家具設計結果缺乏實用性。
國內設計領域學者也曾對生成式AI在協助進行產品設計方面的價值進行研究。研究結果顯示,在產品設計初期,需要衍生眾多創意;使用AI能快速產生許多可能方案,可加速設計創意形成。但是到設計後期,需要對設計創意進行細部調整優化,並需要考量產品實際使用性與生產製造等因素,這時就需要更多人工介入,無法完全仰賴AI。
除了新產品外型設計,生成式AI也可協助工程師進行產品結構與零組件設計優化。特別是結合積層製造應用,生成及製造具有特殊結構的輕量化零組件(如圖1),可以應用在航太、汽車、機器人等產業。
例如工業機器人領導廠商ABB,與Altair、MX3D公司合作,結合生成式AI及積層製造技術,設計、製造重量更輕的機器手臂結構,可協助強化機器手臂操控性與提升精準度;同時也可以更快速滿足客製化機器手臂研製需求。
資料來源:工研院產科國際所ITIS研究團隊(2023/07)
圖1 使用生成式AI協助產品輕量化結構設計
(三)控制程式自動生成
眾多ChatGPT使用經驗顯示,軟體系統開發人員可以透過生成式AI自動產生程式碼與進行除錯,因此可加速軟體系統研發。
在製造領域,有許多工作都涉及到軟體開發與程式撰寫。包括各類製造與生產管理資訊系統,數值控制(CNC)工具機加工程式(NC code),各類運用於自動化裝置的可程式控制器(PLC)程式,以及工業機器人控制程式等。因此製造領域研發與工程人員,可以透過生成式AI,自動生成相關程式碼,進而縮短軟體與控制系統研發或更新時程。
例如Siemens公司,已使用生成式AI來協助軟體開發人員和自動化工程師,加速PLC程式碼生成。該公司在2023年德國漢諾威工業展中,展示工程團隊如何透過自然語言輸入,由生成式AI自動產生PLC程式碼,進而減少軟體開發時間和降低人為程式撰寫錯誤機會。
(四)知識管理與人員作業協助
企業知識管理是建構獨特競爭優勢,以及強化人員教育訓練、從既有知識衍生新價值的重要工作。但是企業知識類型複雜、資料量龐大,建構與管理需要耗費大量人力、時間與資金;即使是大公司也不容易成功推動。而透過生成式AI,可以將企業內部中不同類型知識串聯,並針對人員作業或訓練需求,快速產生有用的輔助資訊內容。包括設備維護手冊與維修紀錄,生產與管理標準作業程序(SOP),人員訓練教材等,都可作為生成式AI訓練學習資料,並用來進行企業知識管理與人員作業協助。
例如美國新創公司Pryon,研發AI人員輔助工作平台,可透過上下文關聯、自然語言、生成式AI來蒐集、彙整企業各類資訊;並透過語音助理,讓企業員工可以從不同管道快速檢索、取得所需資訊,提高作業效能。
(五)智慧化人機介面
類似ChatGPT的生成式AI,可以流暢的用文字與使用者對話。生成式AI,結合語音辨識技術,可以建構出能理解人類自然語言,並進行有意義對話的智慧化人機介面。可應用在各種製造場域機台與設備操作、維護,實現人機協作,以及提供更快速的客戶服務。
Google及Microsoft公司,都在嘗試發展以生成式AI實現更簡便的機器人控制方案。例如以自然語言或感測影像資料,指揮機器人完成指定工作。未來也可能出現可與操作人員對話的加工機械設備,能依據自然語言快速設定工作程序,以及提出異常問題警示及故障排除方案建議。
三、國際廠商發展動態
目前許多國際廠商正持續發展生成式AI方案,未來在製造場域將會出現更多相關應用。以下僅針對部分廠商,以生成式AI進行產品設計及機器人控制的研發狀況進行說明。
(一)生成式AI產品設計
相較於以文字或自然語言作為提示,讓生成式AI執行產品設計工作,美商PTC認為以3D資訊作為輸入,再由生成式AI直接產生3D設計圖的運作模式會更為恰當。PTC認為3D零件特徵和外型輪廓都具有相當複雜性,不容易只依靠一段文字描述,就能讓生成式AI產生所需零件設計。設計者反而可能因為無法直接獲得精確設計結果,需要反覆調整輸入提示,進而增加設計工作時間。
PTC的3D CAD產品Creo已具備生成式設計功能。使用者可先提供一個3D建模概念,AI就會依據此概念,生成符合需求的3D設計結果。未來也會在雲端CAD軟體Onshape中提供生成式3D功能。
Creo系統中提供兩種生成式設計工具:Generative Topology Optimization (GTO)及Generative Design Extension (GDX)。GTO能依據材質、製程,自動生成具優化結構的零組件設計結果。GDX則採雲端設計,允許使用者設定多組製程、材料,然後會產生多組優化設計結果給設計人員參考、評估。
(二)生成式AI機器人控制
Google和德國柏林工業大學(Technical University of Berlin)研究人員,已共同推出可用於機器人控制的PaLM-E多模態視覺語言模型(VLM)。PaLM-E結合視覺模型ViT(具有220億參數)以及語言模型PaLM(具有5,400億參數),並綜合自然語言及視覺訓練,使機器人可以理解人類的指令,以及將環境及物體影像納為輸入,進而即時完成人類指定工作。
PaLM-E屬於實體(Embodied)語言模型,能接受連續的感測器訊號,並將文字和環境、物件圖像,以及機器人本身狀態等感知資訊相連結。
Google公布使用PaLM-E對機器人進行控制的範例,是要求機器人從桌內抽屜將玉米片拿給下命令人員。機器人首先需要從人員下達指令中確認具體工作要求,然後再借助機器視覺協助,從抽屜中找到玉米片並遞送給人員。在進行測試時,研究人員也故意製造外部干擾,將玉米片從機器人手中搶走,並放回抽屜內。機器人隨後會再從抽屜內將玉米片拿出,並遞送給下命令人員。
Google所做的研究顯示,透過生成式AI,使用自然語言或肢體動作來進行機器人即時控制是可能的。這將可大幅降低機器人導入門檻(減少專業人員教導或撰寫控制程式需求),以及增加使用彈性與便利性。
四、結論
鑑別式與生成式AI都是基於機器學習的人工智慧技術。在過去幾年,鑑別式AI技術在製造領域應用正加速擴散,並在品質檢測、設備健康診斷、人員安全與作業效能提升、確保工作場域環境安全等方面顯現AI應用方案價值。而在ChatGPT發布後,如何挖掘生成式AI在包含製造業在內的各種產業應用潛力與價值,也成為新興話題。
經過適當訓練的生成式AI,可自動、快速產生新的文字、圖像、影音內容,以及3D模型、程式碼。因此在製造場域的潛在應用包括:協助挖掘新市場機會與產品需求;加速創新產品設計及獲得優化設計;軟體系統、工具機、自動化裝置、機器人控制程式自動生成;增加企業建構知識管理系統能力與降低成本,並透過資料與資訊快速擷取、彙整,提供人員作業即時輔助;透過智慧化人機介面,強化機器人、設備控制與人機協作能力。
國內製造業者未來可以透過與產學研界AI研究團隊合作,針對上述製造場域應用類型,以通用性的生成式AI基礎模型,結合產業專門資料,進一步建構符合製造業應用需求的客製化生成式AI模型。
(本文作者為工研院產科國際所執行產業技術基磐研究與知識服務計畫產業分析師)
點閱數:
13226