加州大学伯克利分校的研究人员提出了一种人工智能算法,可实现目标导向对话代理的零样本获取
这些大型语言模型在各种自然语言任务中表现出了强大的能力,例如文本摘要、问答和生成代码。 它们是解决许多现实世界问题的强大解决方案。 这些模型在目标导向的对话方面存在问题,它们必须通过对话来实现特定目标。 例如,他们可能会被要求充当高效的旅行代理,以提供定制的旅行计划。 在实践中,这些模型往往会给出非个性化的冗长响应。
这些模型通常无法执行此类任务,因为它们尚未针对多个对话的整体结果进行优化。 他们缺乏的另一个领域是应对不确定性的能力。 加州大学伯克利分校的研究人员在本文中探索了一种使法学硕士适应目标导向对话的方法。 他们贡献了一种优化的零样本算法和一个称为想象力引擎的新系统,该系统可以生成各种与任务相关的问题来训练下游代理。
研究人员使用法学硕士来生成场景,因为单独的 IE 无法产生有效的代理。 需要多步骤强化来确定增强代理有效性的最佳策略。 研究人员修改了这种方法。 他们使用基于价值的强化学习而不是任何策略样本来直接从合成数据中学习新策略。
来源和详细信息:
https://www.marktechpost.com/2023/11/18/uc-berkeley-researchers-propose-an-artificial-intelligence-algorithm-that-achieves-zero-shot-acquisition-of-goal-directed-dialogue-agents/