神经元网络能够基于自然语言概括组合规则。

在本研究中,我们利用自然语言处理的最新进展来构建 RNN 能力的易处理模型,以学习使用预训练的语言转换器来同时执行一组心理物理任务,从而为当前任务嵌入自然语言指令。 RNN 能够使用预先训练的语言转换器为当前任务嵌入自然语言指令,从而学习同时执行多个心理物理任务。 我们性能最佳的模型可以使用这些嵌入来创建平均正确率为 83% 的新模型。 概括其性能的模型使用指令嵌入(类似于任务表示)和嵌入指令之间的通用组合结构。 这使他们能够对未知任务所需的感觉运动转换做出良好的推断。 我们证明网络能够反转信息,并仅使用其观察到的感觉运动意外事件来给出任务的语言描述。

我们的模型预测了整合语言信息以控制感觉运动区域的大脑区域中可以预期的神经表征。 CCGP 分析表明,当人类需要根据指令进行概括(或在多个相关任务之间切换)时,感觉运动映射中发现的神经几何也存在于指令的语义表示中。 这一预测得到了实验文献的充分支持,其中多项研究表明,在我们的感觉运动 RNN 中发现的抽象结构也存在于生物大脑的感觉运动区域中3,36.37。 根据我们的模型,语言区域内类似的任务相关结构的发展对于受指导的人类行为至关重要。 左下回的语言选择子区域是一个有趣的候选区域,可能支持此类表征。 该区域对句子理解的词汇语义和句法方面都很敏感,涉及需要语义控制的任务,并且在解剖学上与左额下回的另一个功能子区域相邻,该子区域涉及灵活的认知38,39,40, 41. 我们预测,实现感觉运动图的各个单元将根据输入指令中的语义在反复试验的基础上调节其调整属性。 未能按预期进行调整应该会导致全球化不佳。 这一预测对于解释人类的多单元记录特别有用。 最后,我们可以得出结论,将语言知识与任务集中的感觉运动需求相结合可以提高所有模型的性能(图)。 我们预测(图2e)语言处理的顶层应该由与语言输入相关的具体过程决定。 例如,运动规划和可供性评估42。

鉴于 GPTNET (XL) 与其他模型相比至少使用了更多的参数,这一点尤其引人注目。 这是特别引人注目的,因为这些模型的活动预测了人类语言处理的许多行为和神经信号10,11。 未来的成像研究可以由自回归模型和最佳表现模型来指导,这些模型代表了参与语言处理各个阶段的大脑区域,从下一个单词的低级预测到结构化句子的高级表示,再到 感觉运动控制语言的影响。

来源和详细信息:
https://www.nature.com/articles/s41593-024-01607-5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注