目前位置: 首頁 > 最新消息
:::

最新消息

聯合學習發展趨勢與對臺灣產業的影響 [趨勢新知]
種類:其他公告  發布單位:技術處  發布日期:2021-07-21 10:30
作者:葉逸萱/工研院

一、全球聯合學習解決方案市場與垂直產業應用

聯合學習於2016年由Google提出,是一個分散式機器學習的概念。在過程中,擁有數據的參與者可獨自進行AI模型的訓練,之後藉由貢獻自己的AI訓練模型參數,共同來優化所有的模型,以不同於過往獨自的模型訓練方式,突破AI廣適性的限制與資料不足的問題。也因聯合學習為訓練AI模型中解決數據安全與隱私的問題,近年來受到廣泛的關注。

二、數據應用需求與聯合學習發展趨勢

(一)產業數據量與分析需求劇增

現在是數據當道的世代,數據應用已是全球貫徹決策的重要核心,加上物聯網相關技術成熟,不同領域爭相採用IIoT裝置,所蒐集到的數據量十分龐大,根據IDC報告指出,2019年全球數據量為45ZB,預計至2025年將成長到175ZB。此外,從許多國際智庫的研析中發現,僅有不到1%的非結構化數據被妥善運用、且不到50%的結構化數據用於企業決策中,顯示大部分的數據尚未充分發揮其潛力。

(二)聯合學習分析的商機與挑戰

聯合學習分析可以改善單一企業因數據孤島無法建構準確的AI模型、或是單一企業多源資料源彙整不易問題,透過各點/各企業分散式機器學習,互利又不需交換數據的機制,來達到AI模型優化的結果。由於聯合學習分析於醫療的成效(特別是COVID-19應用),讓更多的企業了解其帶來的好處,以及釋放數據價值的潛力,因此也提高企業採用聯合學習的意願。

聯合學習可為數據隱私帶來解決方案,但仍有一些挑戰需要克服。例如:

(1)溝通效率問題:由於聯合學習由多方共同參與,因此須找出共通性關鍵議題,並針對問題進行定義、認知共識、產出項目、至初始AI模型的產生,將耗費許多溝通成本。若問題改變,則須重新定義和討論,導致效率不佳。

(2)異質性問題:例如每個參與者所具備的系統、運算能力、存儲等方面不一致;參與者所擁有的數據豐富性不同,可能使得擁有豐富數據者,因模型參數平均效果下,導致自身精準度下降。

(3)間接資訊洩漏:雖然聯合學習不須將資料上傳,但在傳送模型參數的過程中,仍可能受到模型逆推攻擊(Model Inversion Attack),透過參數回推特定使用者的資料。

(三)國際大廠佈局與應用案例

國際主要兩大聯合學習框架為Google發布的TensorFlow Federated (TFF)和Facebook與OpenMined開發的PySyft。雖然聯合學習技術處於早期發展階段,但已有國際科技大廠(如Google、NVIDIA、Intel、IBM…)、新創業者(如Giant Oak、Consilient、Data Republic、DataFleets、Xayn…)、金融企業(如新加坡聯合海外銀行、澳洲ANZ集團、西太平洋銀行…)等投入探索與試驗。

例如2019年NVIDIA、Owkin和倫敦國王學院(King's College London)合作,在NVIDIA Clara上運行Owkin Connect來建立一個醫療保健服務的聯合學習平台。此平台透過區塊鏈技術讓參與的每家醫院都可以取得和追蹤訓練模型的各項數據,所訓練出的AI模型可用於癌症、心臟衰竭及神經退化性疾病等研究預測。

2020年NVIDIA與麻省布萊根綜合醫院合作的EXAM (EMR CXR AI Model)計畫,研發可判斷新冠肺炎患者在初步檢查後的數小時或是數天內是否需要補充氧氣的AI模型,此研發成果有效輔助醫師判斷應給予新冠肺炎患者何種程度的醫療照顧。

三、我國聯合學習發展現況

我國近兩年也陸續有研發單位、企業、醫療機構投入相關應用,例如2020年11月3日Taiwan AI Labs宣布成立「臺灣聯合學習醫療聯盟」,將採用其研發之開源框架Harmonia,以分享模型取代資料共享,解決醫療數據機敏性問題。其中,臺北榮總透過Harmonia進行腦轉移瘤AI模型訓練及優化、臺大醫院建立COVID-19胸部X光自動檢測系統、以及心臟電腦斷層冠狀動脈最佳相位Al智慧選取等研究。

四、結論

由國際技術發展趨勢與產業應用得知,數據孤島和數據隱私是AI發展的重要挑戰,聯合學習提供一個較安全的解決方案,也因此吸引國際科技公司、大型企業、新創公司積極投入。在臺灣方面,我國醫療業(具健保數據、影像標註資料庫、專業人力)、製造業(如晶片、網通及終端設備等)為高度優勢產業,面對疫情衝擊,各國積極研究醫藥和打造自己的半導體產業,為了維持我國產業的競爭優勢,更應善用大數據。

然臺灣產業環境以中小企業為主,具備完善AI分析環境、工具與人才並不容易,因此,本研究建議除了政府策略推動外,也建議我國雲端服務提供者,加強邊緣機器學習與聯合學習的投入,以平台即服務的概念,整合與簡化由本地訓練、邊緣推論到雲端的過程,提供產業跨組織、多源數據庫的安全協同機制,亦是提升客戶黏著度的重要應用。

點閱數346
更新日期:2020-04-28

回上一頁 回首頁