
在AI時代,人形機器人已經被視為最有發展潛力的AI載具之一。各大業者的積極投入,看似在不久的將來就能迎來機器人的「iPhone時刻」。然而,就如同個人電腦、筆記型電腦與智慧型手機等歷代資通訊產品一樣,不管再怎樣宣稱產品的創新,能不能進入大眾生活才是產品成功的關鍵。人形機器人當然也不能免俗,在2024年之前,我們可能會問這真的能做到嗎?不過,從今(2025)年開始,我們應該可以估算還有多遠了。
人形機器人發展的瓶頸,不外乎在於「高昂的成本」和「有限的用途」。前者可以依靠產量和生產技術逐漸克服,但後者就需要新技術的突破,才能讓機器人能自己學習和理解該怎樣做事。在今(2025)年2月,Figure AI推出最新的Helix模型,成功讓機器人能夠「用看的」學習、「用聽的」接收指令,實際執行複雜的任務動作,更能多機協作。
AI模型的技術突破讓人形機器人能夠自主學習
能讓機器人突破學習的瓶頸,主要歸功於Vision-Language-Action (VLA)模型的發展,讓人形機器人能夠透過視覺感知和自然語言理解執行任務動作。VLA模型其實在2023年Google發表的Robotic Transformer 2(RT-2)就已經開始應用,並且也有如OpenVLA、π0相關的開源專案。將VLA和人形機器人整合,就可以讓機器人可以透過觀察人類的行為和環境,持續學習如何執行受指派的任務。
舉個例子來說,我們可以跟搭載Helix模型的機器人示範怎樣拿起水壺倒水,機器人就可以學會拿起類似大小的容器,慢慢的把液體倒出。這種無須編碼,無須工程師調整的學習方式,已經很接近人類學習的行為。所以,搭載Helix模型的Figure AI機器人,可以結合每秒7-9次的深度邏輯推理能力,和每秒大約200次的語意反應能力,組合出驅動四肢動作的參數。如此的確可以期待人形機器人能夠自主適應環境和執行複雜任務的目標。

資料來源:Figure AI 官網,2025年2月,資策會數轉院重製
人形機器人距離商用和家用還有多遠?
看到這裡,大家或許想問,這樣3-5年內人形機器人有機會進入商業或家用環境嗎? 以這樣的發展速度看起來,似乎可能性是非常的高,主要的幾個積極指標是:
- 人形機器人的關鍵零組件成本開始下降:佔人形機器人成本超過60%的四肢與驅動等相關組件,在大量生產後已經開始下降。各大IC設計業者也積極發展自家機器人邊緣運算平台。
- VLA模型的效能持續優化: Figure01運行Helix模型可以靠低功耗的算力單元完成,且模型參數並不大,顯示VLA模型的優化已有成果。
- 自主學習和多機協作功能降低導入障礙: 適應環境一直是機器人導入實際服務的關鍵之一,自主學習功能的發展將可以大幅縮短導入訓練時間;多機協作功能的出現,可期待有效率加乘的效果。
人形機器人在學習上的突破,確實拉近了商用和家用上的進程。不過運行安全性上的議題,或許會成為佈署的最後一哩路。國際上在服務型機器人產品已有許多運行安全、共通模組介面等研究和標準發布。在實際進入家用和不同商用場域前,仍然需要更多的測試,才能了解機器人實際運作上可能帶來的風險。
本文作者:資策會數位轉型研究院智造科技中心副主任謝沛宏