将深度神经网络的成功扩展到自然语言理解和符号推理上需要复杂的运算和外部的记忆。最近的神经程序诱导方法(neural program induction approaches)已经在尝试解决这个问题了,但这种方法通常受限于可微分的记忆(differentiable memory),因此只能执行一些小型的合成任务,不能进一步扩展。在这项成果中,我们提出了 Manager-Programmer-Computer(管理器-编程器-计算机)框架,其整合了神经网络和不可微分记忆(non-differentiable memory)以支持通过一个友好的神经计算机接口执行抽象的、可扩展的和精准的运算。具体来说,我们引入了一种神经符号机(NSM:Neural Symbolic Machine),其包含了一个序列到序列(seq2seq)神经「编程器(programmer)」和一个不可微分的「计算机(computer)」——该计算机是一个带有代码协助(code assist)的 Lisp 解释器。为了成功将 REINFORCE 用于训练,我们通过使用一个迭代式的最大似然训练过程(iterative maximum likelihood training process)所找到的近似黄金程序(approximate gold programs)来增强它。NSM 可以通过弱监督(weak supervision)的方式在大型知识库上训练语义解析器(semantic parser)。其通过弱监督的方式在很有挑战性的语义解析数据集 WebQuestionsSP 上实现了新的当前最佳的表现。和之前的方法相比,NSM 是端到端的(end-to-end),因此无需依赖特征工程或特定领域的知识。