Billy Tong
Google和一些Alphabet的子公司研究員指出,機械人透過共享學習經驗,可更快學會執行一些簡單任務。
當擁有金鋼不壞之身的機器有了學習的能力,統治人類似乎已經不遠了?
研究人員正以「增強學習技術」(Reinforcement Learning)的方式,結合反覆試驗、失誤和正面反饋,來訓練工業機器人執行簡單任務。
目前,他們教授機器人的任務還是非常簡單(如開門和輕推物件),但在不久的將來,機器人或可開始處理日常瑣事(如摺衣服和洗碗)。
機械人變得愈來愈價廉物美。可是,要透過編程(Programming),令它們可在充滿未知因素的日常環境穩定地執行任務,是近乎不可能的事。
世事多變,機器人未能排除變因,所以仍只能執行簡單的任務。但未來呢?如果它們真發展出了演化的能力呢?
增強學習技術,或可提供一個解決方案,讓機械人在工作學習中為自己編程。然而,要一個機械人在過程中反覆嘗試無數方法,將會非常耗時。於是,學者正研究一種雲端技術,透過機械人共享學習,大大節省機械人反覆試驗的時間。可是,這種技術仍是停留發展初段。
最近,Google的研究團隊詳述了一些讓機械人共享學習的策略。在每一種情況,正進行學習的機械人,會用它們的人工神經網絡(Neural Network),預測不同動作的結果。每個機械人的行為表現,都會有些微不同,差異會漸漸強化。機械人們的神經網絡,會定期匯報給一個中央伺服器,而該中央伺服器,會為機械人建立一個結合不同機械人學習成果的全新神經網絡,再重新輸入到每個機械人,以進行下一輪訓練。
雖然現在多半只有一隻手臂,但難說哪一天,雲端情人就真的誕生了。
在第一輪實驗,機械人要轉動門柄開門。四部機械人各自開啟一道不同設計的門。它們共享學習經驗以後,在實驗最後一環,儘管機械人們要開啟一道四部機械人都從未遇過的門,機械人們都成功完成任務。
在第二輪實驗,機械人們與一個人為控制的機械臂進行互動,它們的學習進展大大加快了。在第三輪實驗,機械人透過攝像機輸入的資料,學會移動和旋轉物件,以及預測不同行動會如何改變攝像機傳來的圖像。
美國布朗大學助理教授Stefanie Tellex一直研究機械人學習,她指Google的實驗令人振奮:
「讓機械人預測不同動作的物理效果,可使它們理解我們的世界如何運作。」
透過機器學習技術,Google團隊正研究更多革命性的機械人應用。現在,已有不少機械人生產商研究如何運用增強學習技術,精簡產品的編程工序。現階段,機械人所能學到的還很有限,但隨著算術改善,機械人應用更廣泛,在未來了會更能幫助我們的日常生活。
本文經授權轉載自Outside Google建立了一所機械人幼稚園