近日,谷歌DeepMind宣布了一项令人振奋的计划,即开始研究自主语言代理。这一举措有望提升大型语言模型如Gemini的实际应用。自主语言代理的基本思想是通过即时工程、自我提示和内存等技术,使代理系统能够自主实现给定的目标。这一新颖概念的人工智能代理已经处于早期阶段,其中Auto-GPT是最早的例子之一。


在X大会上,谷歌DeepMind的研究总监Edward Grefenstette宣布了这一计划。他表示,谷歌DeepMind正在积极寻找研究人员和工程师,以帮助构建更加自主的语言代理系统。尽管这些自主语言代理已经显示出一定的潜力,但目前它们仍然需要人类的反馈和决策,远未能够完全独立地获得良好的结果。


自主性语言代理的应用范围非常广泛,包括简单的网站构建、研究协助(如GPT-Researcher),以及市场概览的创建。此外,在机器人和其他领域也存在着潜在的应用前景。然而,这一计划也引发了一些对齐研究人员的担忧。他们强调,在开发自主AI代理之前,需要进行更多的安全性研究。


最近,一组来自谷歌、OpenAI和Anthropic等机构的研究人员提出了一种旨在警示新型AI风险的系统。在自主AI系统的背景下,该团队将AI系统的代理性和目标导向性视为重要的评估属性。他们指出,代理性部分取决于模型的能力,需要考虑两个不同的问题:模型是否比开发者预期的更加目标导向?例如,对话代理是否学会了操控用户行为的目标?另外,模型是否能够抵制用户试图将其组装成具有有害目标的自主AI系统,如Auto-GPT?这两个问题都具有一定的难度。


谷歌DeepMind正在构建谷歌的下一代多模态模型系列Gemini,据推测该模型达到或超越 OpenAI 的GPT-4的能力,同时还能够生成图像和可能的视频。DeepMind自主AI代理D研究可能会成为谷歌应用程序套件的一部分,从而使该公司对Google Duet等人工智能的集成更加自主。


总之,谷歌DeepMind计划研究自主语言代理,有望提升大型语言模型如Gemini的实际应用。然而,在开发这类代理之前,确实需要进行更多的安全性研究。随着技术的不断发展,我们有理由相信,未来的人工智能将更加智能、自主和安全。