谷歌發(fā)布史上最大“通才”AI模型，可讓機器人更自主

發(fā)布時間：2023-3-9 09:10 發(fā)布者：eechina

關(guān)鍵詞：谷歌 , AI模型 , 機器人

來源：大半導(dǎo)體產(chǎn)業(yè)網(wǎng)

據(jù)報道，近日，谷歌和柏林工業(yè)大學(xué)的團隊重磅推出了史上最大的視覺語言模型——PaLM-E。通過PaLM-540B語言模型與ViT-22B視覺Transformer模型相結(jié)合，PaLM-E參數(shù)量高達5620億（GPT-3的參數(shù)量為1750億）。

作為一種多模態(tài)具身視覺語言模型（VLM），PaLM-E不僅可以理解圖像，還能理解、生成語言，可以執(zhí)行各種復(fù)雜的機器人指令而無需重新訓(xùn)練。谷歌研究人員還觀察到一些有趣的效果，這些效果顯然來自PaLM-E的核心——大型語言模型。PaLM-E表現(xiàn)出了“正遷移”能力，即它可以將從一項任務(wù)中學(xué)到的知識和技能遷移到另一項任務(wù)中，從而與單任務(wù)機器人模型相比具有“顯著更高的性能”。

谷歌研究人員計劃探索PaLM-E在現(xiàn)實世界場景中的更多應(yīng)用，例如家庭自動化或工業(yè)機器人。他們希望PaLM-E能夠激發(fā)更多關(guān)于多模態(tài)推理和具身AI的研究。

本文地址：http://m.qingdxww.cn/thread-813196-1-1.html 【打印本頁】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)；文章版權(quán)歸原作者及原出處所有，如涉及作品內(nèi)容、版權(quán)和其它問題，我們將根據(jù)著作權(quán)人的要求，第一時間更正或刪除。

網(wǎng)友評論

貿(mào)澤電子有獎問答視頻，答對領(lǐng)10元微信紅包

国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

谷歌發(fā)布史上最大“通才”AI模型，可讓機器人更自主

相關(guān)文章

網(wǎng)友評論

廠商推薦

相關(guān)視頻