AI研究人员开发了一种方法,Toolformer:语言模型可以自学使用工具,可以轻松地让像 Chat-GPT4 这样的 AI 访问和使用外部软件程序来增强其能力,语言模型(LMs)在处理新任务时表现出卓越的能力,仅凭几个示例或文本指令就能解决问题,尤其是在规模方面。然而,它们在基本功能上却往往表现不佳,如算术或事实查找,而更简单、更小的模型却表现出色。
在该研究中,作者展示了 LM 可以通过简单的 API 自学使用外部工具并实现两全其美。他们介绍了 Toolformer,这是一个经过训练的模型,可以决定调用哪些 API、何时调用它们、传递哪些参数,以及如何最好地将结果纳入未来的标记预测。这是以自我监督的方式完成的,只需要对每个 API 进行少量演示。他们整合了一系列工具,包括计算器、问答系统、两个不同的搜索引擎、翻译系统和日历。
Toolformer在各种下游任务中实现了显著改进的零样本学习性能,通常与更大的模型竞争,而不牺牲其核心语言建模能力。找有价值的信息,请记住Byteclicks.com
版权声明:除特殊说明外,本站所有文章均为 字节点击 原创内容,采用 BY-NC-SA 知识共享协议。原文链接:https://byteclicks.com/47948.html 转载时请以链接形式标明本文地址。转载本站内容不得用于任何商业目的。本站转载内容版权归原作者所有,文章内容仅代表作者独立观点,不代表字节点击立场。报道中出现的商标、图像版权及专利和其他版权所有的信息属于其合法持有人,只供传递信息之用,非商务用途。如有侵权,请联系 gavin@byteclicks.com。我们将协调给予处理。
赞