谷歌DeepMind發布新型機器人人工智能模型

發布時間：2025-3-14 09:41 發布者：eechina

谷歌旗下的DeepMind公司在人工智能領域再次取得重大突破，于昨日正式發布了兩款專為機器人設計的人工智能模型：Gemini Robotics和Gemini Robotic-ER。這兩款模型的問世，標志著谷歌DeepMind在推動機器人技術智能化、提升機器人在現實世界任務中的執行能力方面邁出了關鍵一步。

據DeepMind官方介紹，Gemini Robotics和Gemini Robotic-ER是基于大型語言模型的推理能力而開發的，旨在幫助機器人更好地適應復雜多變的環境，完成各種現實世界中的任務。其中，Gemini Robotics是一款視覺-語言-動作模型，它不僅能夠概括新場景，還能更善于與人和環境互動，執行更精確的物理任務，如折疊紙張、擰下瓶蓋等。該模型在通用性、交互性和靈活性三大關鍵領域表現出色，能夠理解廣泛的自然語言指令，并根據輸入調整行為，持續監控周邊環境以檢測變化，從而調整動作。

而Gemini Robotic-ER（即具身推理）則是一款具備增強空間理解能力的先進視覺-語言模型。它能夠使機器人專家利用Gemini的具身推理能力運行自有程序，完成更為復雜的推理過程。例如，在打包午餐盒時，Gemini Robotic-ER能夠知道所有東西的位置，以及如何打開午餐盒、抓取食物并將它們放在合適的位置。這一特性使得機器人在處理復雜任務時更加得心應手。

DeepMind表示，要成為對人類有用的機器人AI模型，必須具備三大核心特質：通用性、交互性和靈巧性。新發布的這兩款模型正是基于這些特質而設計的，它們能夠讓多種機器人執行比以往更廣泛的現實任務，從而幫助人類在家庭、職場等場景中更好地與機器人協作。

在技術層面，Gemini Robotics的綜合泛化性能是現有最先進視覺-語言-動作模型的兩倍以上，這得益于DeepMind在算法優化和模型訓練方面的深厚積累。而Gemini Robotic-ER則在安全性方面進行了重點考慮，DeepMind正在開發一種“分層方法”，以評估在特定情境下潛在行為的安全性，并訓練Gemini Robotic-ER模型進行相應判斷。

此外，DeepMind還發布了新的基準和框架，以助力人工智能行業的安全研究。去年，谷歌DeepMind推出了“機器人憲法”，這是一套受艾薩克·阿西莫夫啟發的規則，供機器人遵循。此次發布的兩款模型也將在這一框架下進行運作，以確保其在執行任務時始終遵循安全、可靠的原則。

本文地址：http://m.qingdxww.cn/thread-883758-1-1.html 【打印本頁】

本站部分文章為轉載或網友發布，目的在于傳遞和分享信息，并不代表本網贊同其觀點和對其真實性負責；文章版權歸原作者及原出處所有，如涉及作品內容、版權和其它問題，我們將根據著作權人的要求，第一時間更正或刪除。