谷歌DeepMind發(fā)布新型機(jī)器人人工智能模型

發(fā)布時(shí)間：2025-3-14 09:41 發(fā)布者：eechina

關(guān)鍵詞：谷歌 , DeepMind , 機(jī)器人 , 人工智能模型

谷歌旗下的DeepMind公司在人工智能領(lǐng)域再次取得重大突破，于昨日正式發(fā)布了兩款專為機(jī)器人設(shè)計(jì)的人工智能模型：Gemini Robotics和Gemini Robotic-ER。這兩款模型的問世，標(biāo)志著谷歌DeepMind在推動(dòng)機(jī)器人技術(shù)智能化、提升機(jī)器人在現(xiàn)實(shí)世界任務(wù)中的執(zhí)行能力方面邁出了關(guān)鍵一步。

據(jù)DeepMind官方介紹，Gemini Robotics和Gemini Robotic-ER是基于大型語言模型的推理能力而開發(fā)的，旨在幫助機(jī)器人更好地適應(yīng)復(fù)雜多變的環(huán)境，完成各種現(xiàn)實(shí)世界中的任務(wù)。其中，Gemini Robotics是一款視覺-語言-動(dòng)作模型，它不僅能夠概括新場景，還能更善于與人和環(huán)境互動(dòng)，執(zhí)行更精確的物理任務(wù)，如折疊紙張、擰下瓶蓋等。該模型在通用性、交互性和靈活性三大關(guān)鍵領(lǐng)域表現(xiàn)出色，能夠理解廣泛的自然語言指令，并根據(jù)輸入調(diào)整行為，持續(xù)監(jiān)控周邊環(huán)境以檢測變化，從而調(diào)整動(dòng)作。

而Gemini Robotic-ER（即具身推理）則是一款具備增強(qiáng)空間理解能力的先進(jìn)視覺-語言模型。它能夠使機(jī)器人專家利用Gemini的具身推理能力運(yùn)行自有程序，完成更為復(fù)雜的推理過程。例如，在打包午餐盒時(shí)，Gemini Robotic-ER能夠知道所有東西的位置，以及如何打開午餐盒、抓取食物并將它們放在合適的位置。這一特性使得機(jī)器人在處理復(fù)雜任務(wù)時(shí)更加得心應(yīng)手。

DeepMind表示，要成為對(duì)人類有用的機(jī)器人AI模型，必須具備三大核心特質(zhì)：通用性、交互性和靈巧性。新發(fā)布的這兩款模型正是基于這些特質(zhì)而設(shè)計(jì)的，它們能夠讓多種機(jī)器人執(zhí)行比以往更廣泛的現(xiàn)實(shí)任務(wù)，從而幫助人類在家庭、職場等場景中更好地與機(jī)器人協(xié)作。

在技術(shù)層面，Gemini Robotics的綜合泛化性能是現(xiàn)有最先進(jìn)視覺-語言-動(dòng)作模型的兩倍以上，這得益于DeepMind在算法優(yōu)化和模型訓(xùn)練方面的深厚積累。而Gemini Robotic-ER則在安全性方面進(jìn)行了重點(diǎn)考慮，DeepMind正在開發(fā)一種“分層方法”，以評(píng)估在特定情境下潛在行為的安全性，并訓(xùn)練Gemini Robotic-ER模型進(jìn)行相應(yīng)判斷。

此外，DeepMind還發(fā)布了新的基準(zhǔn)和框架，以助力人工智能行業(yè)的安全研究。去年，谷歌DeepMind推出了“機(jī)器人憲法”，這是一套受艾薩克·阿西莫夫啟發(fā)的規(guī)則，供機(jī)器人遵循。此次發(fā)布的兩款模型也將在這一框架下進(jìn)行運(yùn)作，以確保其在執(zhí)行任務(wù)時(shí)始終遵循安全、可靠的原則。

本文地址：http://m.qingdxww.cn/thread-883758-1-1.html 【打印本頁】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)；文章版權(quán)歸原作者及原出處所有，如涉及作品內(nèi)容、版權(quán)和其它問題，我們將根據(jù)著作權(quán)人的要求，第一時(shí)間更正或刪除。

網(wǎng)友評(píng)論

貿(mào)澤電子有獎(jiǎng)問答視頻，答對(duì)領(lǐng)10元微信紅包

国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

谷歌DeepMind發(fā)布新型機(jī)器人人工智能模型

相關(guān)文章

網(wǎng)友評(píng)論

廠商推薦

相關(guān)視頻