新闻详情

Google 发布全球最大视觉语言模型 PaLM-E

近来,来自谷歌和德国柏林工业大学的一组人工智能研究人员发布了史上最大视觉言语模型 PaLM-E(全称 Pathways Language Model with Embodied)。

作为一种多模态具身视觉言语模型 (VLM),PaLM-E 能将视觉和言语集成到机器人操控中。谷歌和柏林工业大学称,PaLM-E 是迄今为止人类开发的最大规划 VLM,其能够在不需要再练习的情况下履行各种使命。此外,经过 PaLM-540B 言语模型与 ViT-22B 视觉 Transformer 模型相结合,PaLM-E 终究的参数量高达 5620 亿(GPT-3 的参数量为 1750 亿),这是全球已知的最大视觉言语模型。

曩昔几个月时间里,由 ChatGPT 在全球科技巨子之间引发的人工智能热潮推动了很多言语模型的生产力前置。据《华尔街日报》,尽管谷歌早在两年前就做出了相似 ChatGPT 的人工智能聊天工具,但谷歌对 AI 的小心翼翼情绪让其失去了对生成式 AI 的先机。

来历:

每日经济新闻

← 返回新闻列表