強化智慧機器人性能的關鍵三技術

目前位置：首頁 > 新聞與公告 > 科技新知

科技新知

強化智慧機器人性能的關鍵三技術

智慧機器人、數位孿生、機器人作業系統、ROS、AI

發表日期：2020-03-11

作者：黃仲宏(工研院)

摘要：

數位孿生的應用加上人工智慧自我演化，成為一個能增長智慧的系統，再以ROS，讓感知、即時運動控制、影像處理、定位與導航等技術透過一致性的架構應用到機器人上，在此平台上進行技術整合。

全文：

一、數位孿生技術豐富機器人的經歷

在德國慕尼黑自動化工業與機器人展上，筆者見到某家工業機器人大廠，示範機器人在汽車外鈑塗裝的應用，它透過感測器裝置直接用人體遙控操作機器人，該系統可以讓作業員以遠端協調方式操作機器人進行塗裝作業，作業員利用接受力覺、觸覺、聽覺、視覺的回饋，讓遠端操控宛如直覺性操控，再將操作的內容傳遞給機器人，機器人記住作業員的操作，再轉換成自動運作；這個系統的目的就是要讓不熟練塗裝技術與機器人的作業員，可以立即快速的上手。

利用感測器即時性地大量收集資訊成為大數據，再配合電腦運算能力的強化擴展數位化模擬的應用，數位孿生不僅是實體物體的虛擬版本，更是可透過虛擬端的資料分析、模型建構、控制，對實體物體的活動內容進行深度對稱性管理，應用在研發、製造、操作與服務等流程。

機器人可以快速複製人類大腦的想法嗎，未來我們有沒有辦法直接將人類的想法移植到機器人上？數位孿生就是建構一個虛擬但是具備智慧的數位代理人，此虛擬分身可以根據感測器所蒐集到的數據資料進行運算、分析，產生新的知能，而且可以隨時針對機器人運行狀態進行修正與復原。透過感測器將實體運作的塗裝機器人的真實處境，經由物聯網鏈結到虛擬世界中相對應的數位塗裝機器人。也就是數位孿生機器人將會擁有實體塗裝機器人的腦袋，並儲存實體機器人在塗裝過程中的特質與經歷。

各式智慧型機器人不斷應運而生，且已進一步整合聲學、觸覺、力覺等感測元件，形成各種客製化的專用模組，以便展現更聰敏的智能，執行更靈活的動作。Digital twins，中文稱之為數位雙胞胎、數位分身、數位代理，或是被稱為數位孿生；顧名思義，就是真實世界裡某個實體物體、物件或是系統的數位象徵，一種數位化的模擬。所謂數位化模擬就是將某個實體物體、物件、設備或系統，以資訊科技製成完全相同的虛擬模型，讓人們可以藉由虛擬模型的掌握，瞭解物體在真實世界的狀況。

數位孿生的概念應用在智慧製造上，類似虛實整合系統(Cyber-Physical Systems, CPS)的虛擬模型，透過網路虛擬端的資料分析、模型建構、控制，對實體活動內容的深度對稱性管理。但是與之不同的是，此虛擬模型是有智慧的，並可以透過人工智慧自我演化，透過機器學習技術學習人類不同的塗裝技巧與習慣，再轉換給機器人以自動運作的方式做適當與確實的作業。

如果是應用在服務型機器人上面，透過感測器，此數位孿生機器人將可隨時且完整地複製實體機器人的各個特性，數位孿生機器人還可藉由深度學習技術，將實體機器人所處的情境加以運算，甚至進而產生智慧，或者是提供建議。

目前已經有以人類心智控制身體行動的行動輔助外骨骼機器人，這種特殊的裝備是把人的肢體包起來，然後用馬達讓手腳移動，讓肢體癱瘓的人「用想的走路」，外骨骼機器人目前主要被應用在「再次行走」。如果有一天，每個人都可以擁有自己專屬的實體擬人機器人，藉由各個專屬的數位孿生機器人，我們每個人的智慧與經驗將可以月月年年不間斷地被傳承。

二、ROS活化機器人的靈敏度

雲端技術發展與應用快速崛起，市場潛力無窮，如何處理龐大資料量並讓機器人具有智慧且能彼此溝通，是建置雲端系統的重要發展。我們觀察到市面上許多照護陪伴型、教育娛樂型機器人，在計算能力和記憶體的表現上，已漸漸跳脫出自身的獨立系統，亦即機器人遇到困難時，無法從自身得到解決方法時，就以所謂的群眾運算(Crowd Computing)來克服問題：利用全世界各路人馬開發的人工智慧來幫忙完成工作。

當地球上的某人有了一個新的運算方法，他可以利用機器人作業系統(Robot Operating System, ROS)快速分享給全世界的研究者，也就是運用網路可以得到來自全球各地的研究者共同分享機器人的Code(程式碼)、設計以及數據。

ROS是一個開源式(open source)的機器人開發平台，全世界的機器人開發人員皆可在此共通的平台上進行技術整合，進行相關的研究以及資源分享。我們需要讓感知、即時運動控制、影像處理、人工智慧、定位與導航等技術透過一致性的架構應用到機器人上，在走向開放資源的過程中，它的智慧與腦力將會有等比級數的進展。

2019年12月的iREX ( International Robot Exhibition，日本東京國際機器人展)，多家物流機器人企業展示AGV(Automated Guided Vehicle，自動行走車)產品，當AGV運行至參觀者身旁時，ROS透過感測器測量參觀者的空間位置，進而提供對應服務操作，整個過程在幾秒內就產生了大量的分析、判斷與決策執行，這是運用ROS的效果。NASA(National Aeronautics and Space Administration，美國航空暨太空總署)開發的人型機器人，德國BMW或Bosch的無人車、中國百度的無人車開源架構Apollo，均已使用ROS做為系統整合或是演算法的驗證。ROS在高階機器人與無人車的領域上不斷提高機器人的靈敏度。

機器人智慧化應用中，ROS是最關鍵的一環，因為機器人要能投入生活或是醫療等不同應用場景，都要面對比工廠生產線更複雜的空間環境；如何賦予機器人可在任何地方行走的移動能力，必須仰賴環境空間的感知搭配自身載具導航至定點，同時判斷被服務對象與機器人間的距離與環境空間，驅動對應手臂或是夾具進行傳送服務，此處ROS系統的效用就等同於大腦中樞，不僅即時匯集環境變動數據，也同時分析機器人與被服務對象的相對空間位置，並精準做出對應。

ROS源起於2007年史丹佛大學(Stanford University)的人工智慧實驗室，直至2012年ROS發展團隊獨立，組建OSRF(The Open Source Robotics Foundation)非營利組織，為機器人開發社群提供開放原始碼工具與應用支援。ROS每年發布新版，系統核心以Linux為主，改變了原本以封閉式軟體為主的機器人開發系統，ROS的推動使機器人技術層級更趨大眾化，並建立統一的標準設計架構。

現今更是已進入到需要多台機器人協同工作的時代，需要大量影像快速、精準、不失真的傳遞。而早先的ROS特性已漸漸無法適切地處理現今機器人所遇到的各種挑戰，主要是之前的ROS以有線網路(Ethernet)為主、利用TCP/IP做為通訊協定、在單台機器內做資料傳遞，且通訊品質、通訊安全、資料處理優先權等問題讓空間定位、路徑規劃、傳動機制等多項技術的軟硬體機電整合難度提高。

ROS2.0的出現，解決了上述的缺失，ROS2.0主要用來實現多台機器人的協同工作、支援小型嵌入式系統、可做到即時控制(Real-Time)、可確保在無線環境下的通訊品質。這些最主要的目的就是縮短了機器人商品化的過程，現在ROS2.0已不斷地被驗證中，例如日本的無人車平台Autoware、DroneCode，透過ROS2.0與ROS生態圈對接、美國Intel釋出一連串與ROS2.0相關的影像和AI軟體庫。

高階機器人、無人車要提升其在人類活動環境與人類協作的親和力，強健穩定的靈敏度才能造就高效能與品質的應用與服務，美國、日本等先進國家的機器人發展戰略均集中投資在包括機器人技術的革新活用。在機器學習技術不斷演進，機器人腦袋逐漸變聰明的發展下，更高自由度、更能靈活應用的機器人，被重視的程度將與日俱增。

智慧機器人技術與應用為全球重要的發展趨勢，從傳統的工業機器人，以至賣場服務、居家應用、醫療照護，甚至先進製程。高靈敏度是機器人發展的重點，ROS讓彼此溝通無礙，為機器人營造更寬廣的舞台，也讓機器人未來不再僅是工廠內的獨立元件或工作站，能輕易串聯不同廠牌的機械手臂、AGV或其他設備，藉由ROS實現各種智慧製造應用場景。

三、AI提升機器人的智慧

機器人只能在某一個專精的領域才能勝出人類，例如下西洋棋、建立天氣模型。西洋棋的下法已經出現幾百年，因此只要有電腦的運算能力就可以模擬西洋棋的千百種走法及棋局攻防。如果參照人類意識的定義，那麼可說目前世界上的所有機器人都還停留在非常原始的階段，還在試著學習基礎的事物，還在學習如何認識世界。假若現在要一個機器人去搶劫銀行，首先得讓機器人知道這間銀行的所有基本資料，例如金庫藏錢的地方、具有哪些的保護措施、警衛和旁人會如何反應…。有些狀況可以用程式設定，但是其中有數百個細節，人類的心智可以不費吹灰之力自然而然的瞭解，但是機器人就是很難辦到。

人腦即便是遭受到某種程度的損傷，還是可以有不錯的認知能力；這是因為人類並非數位化的電腦，而是極為複雜的神經網路。電腦有固定的輸入輸出架構，而人類神經網路則是由神經元構成，學習之後會持續改變且強化。人腦中沒有程式、操作系統、視窗軟體，也沒有中央處理器，它是大規模的平行網路，有千億個神經元同時活動，這是相當不同的。當機器人走進房間開始辨認物體及方向時，其程式就得進行數兆次的計算，把看到的物體分析成許多畫素、線條、圓圈、方形和三角形，然後和資料庫中的數千個圖形比對。機器人會把一張桌子看成是由許多點和線構成的大雜燴，但無法體認出「桌子的本質」。即使機器人能成功的比對物體和資料庫的影像，但只要稍微讓桌子翻轉倒地或轉個方向，就會讓機器人陷入迷惘。人類的腦子能自動考量物品不同的角度及變化，人腦的神經元在下意識中運作了數兆次，幾乎不費吹灰之力。

人工智慧還有一個基本問題待解決：普通常識。目前機器人最好的立體視覺可以比人眼看的更多看的更精細，但是機器人無法辨識所看到的東西，它不知眼前放的到底是一個網球還是一顆橘子，如果把機器人放到人來人往的逢甲夜市，它很有可能一下子就會失去方向而迷路；圖形辨識和普通常識的進展是機器人能否像「人」的重要關鍵。普通常識對機器人而言是個大問題，它們不了解這個物理世界和生物世界的簡單事實。例如「天氣好熱不舒服」、「媽媽的年齡比女兒年長」；把這些訊息轉譯成數學邏輯的工作已經有些進展，不過要把5歲大的小朋友所具備的普通常識分門別類讓機器人擁有，至少需要數億行的電腦程式，這必須寄望於電腦記憶體和處理速度的不斷進步。

人類從60年代就已經投入神經網路的研究，提出各式樣的結構發展與學理，但直至90年代，人工智慧的研究還是處於寒冬期，當時包括神經網路和模糊邏輯等學理的實現並沒有達到預期的水準。

不過在許多企業與研究人員長期不斷的研究下，再加上今天在摩爾定律(Morre's Law，IC上可容納的電晶體數目，約每隔18個月便會增加一倍)、吉爾德定律(Gilder's Law，通訊網路系統的頻寬會以每12個月進步3倍的速度)、梅特卡夫定律(Metcalfe's Law，網路的節點會愈來愈多，網路愈能發揮價值)，等這影響科技產業的三大定律不斷演進下，已有可能讓基於CNN(Convolutional Neuron Networks, 卷積神經網路)的深度學習技術解決複雜又實用的問題。基於CNN的人工智慧解決了傳統類神經網路運算量龐大且不易應用至影像之缺點與限制，大幅提升影像檢測與分類之應用。

現今機器視覺系統，皆強調「能快速整合」，視覺是自動化系統的重要模組，因此其能與PLC(可程式邏輯控制器)、其他控制設備、或機器人的快速整合，影像辨識技術幫助人類高效率地完成看的工作，機器人將會像人類一樣快速理解所見之物。不論是工業用或服務型機器人皆可見視覺應用其中，從2D檢測、定位到3D取放、量測、人機協作的相關應用都有。

資料的質變與量變引發了新的挑戰，深度學習技術的開發應用帶來新的競爭力，具體應用包括機器視覺應用，缺陷分析、故障排除等。人工智慧的導入，最大目的是降低因應外界變化所需的成本，這也將革新電腦解釋語音和文字的方式，讓電腦理解語言文字背後豐富的文化與社會情境。這會讓人工智慧擁有更多似人的能力，如常識和邏輯。機器人若是老虎，人工智慧就是翅膀，如虎添翼；AI將強化機器人的智慧，AI的價值讓智慧機器人來彰顯。

四、結論

背後沒有人操控、沒有人使用遙控器或預先程式設定的自動機器是否真的能產生？阿拉伯籍的機器人公民Sophia(蘇菲亞)，已經可靈活做出微笑、生氣和皺眉3種表情；但是她到哪一天才會知道自己是真的機器人呢？打造人工心智的困難程度比我們所想像的還要高出許多，機器的智能何時才能與人類相等或超越人類？

我們看到了一些技術發展的曙光，Digital Twins(數位孿生)、ROS(機器人作業系統)與AI(人工智慧)。數位孿生的應用加上人工智慧自我演化，成為一個能增長智慧的系統，再以ROS，讓感知、即時運動控制、影像處理、定位與導航等技術透過一致性的架構應用到機器人上，在此平台上進行技術整合。

以數位孿生技術豐富機器人的經歷，以ROS提高機器人的靈敏度，以AI強化機器人的智慧...。到底哪一天我們才會處於一個機器人無所不在的世界？沒有人有肯定的答案，但是大多數的人有信心這天很快會到來。

(本文作者為工研院產科國際所執行產業技術基磐研究與知識服務計畫產業分析師)

點閱數：2347

更新日期：2024-10-24