研究敦促在将神经网络与大脑进行比较时要小心

看似产生类似大脑活动的计算系统可能是研究人员引导它们达到特定结果的结果。

Anne Trafton | MIT News Office

神经网络是一种松散地模仿人脑组织的计算系统，构成了许多人工智能系统的基础，用于语音识别、计算机视觉和医学图像分析等应用。

在神经科学领域，研究人员经常使用神经网络来尝试对大脑执行的同类任务进行建模，希望这些模型能够提出关于大脑本身如何执行这些任务的新假设。然而，麻省理工学院的一组研究人员敦促在解释这些模型时应更加谨慎。

在对超过 11,000 个经过训练来模拟网格细胞（大脑导航系统的关键组成部分）功能的神经网络进行分析后，研究人员发现，神经网络只有在受到非常具体的约束时才会产生类似网格细胞的活动，生物系统中未发现。

麻省理工学院前高级研究员 Rylan Schaeffer 表示：“这表明，为了通过网格单元获得结果，研究人员需要训练模型，以将这些结果与特定的、生物学上难以置信的实施选择结合起来。”

如果没有这些限制，麻省理工学院的团队发现很少有神经网络产生类似网格细胞的活动，这表明这些模型不一定能对大脑如何工作产生有用的预测。

Schaeffer 现在是斯坦福大学计算机科学专业的研究生，他是这项新研究的主要作者，该研究将于本月在 2022 年神经信息处理系统会议上发表。伊拉·菲特 (Ila Fiete) 是麻省理工学院麦戈文脑研究所的脑和认知科学教授，也是该论文的资深作者。麻省理工学院物理学研究生米凯尔·科纳 (Mikail Khona) 也是一位作家。

网格单元建模

几十年来，研究人员一直使用神经网络来执行各种计算任务，它由数千或数百万个相互连接的处理单元组成。每个节点与网络中的其他节点都有不同强度的连接。当网络分析大量数据时，这些连接的强度会随着网络学习执行所需的任务而发生变化。

在这项研究中，研究人员重点研究了为模仿大脑网格细胞功能而开发的神经网络，这些网格细胞存在于哺乳动物大脑的内嗅皮层中。网格细胞与海马体中的位置细胞一起形成大脑回路，帮助动物知道自己在哪里以及如何导航到不同的位置。

研究表明，每当动物处于特定位置时，位置细胞就会放电，并且每个位置细胞可能会对多个位置做出反应。另一方面，网格单元的工作方式却截然不同。当动物穿过房间等空间时，只有当动物位于三角形晶格的一个顶点时，网格单元才会放电。不同组的网格单元创建尺寸略有不同的晶格，这些晶格彼此重叠。这允许网格单元使用相对少量的单元来编码大量的独特位置。

这种类型的位置编码还可以根据给定的起点和速度来预测动物的下一个位置。在最近的几项研究中，研究人员训练了神经网络来执行相同的任务，这被称为路径整合。

为了训练神经网络执行这项任务，研究人员向其输入一个起点和一个随时间变化的速度。该模型本质上模仿了动物在空间中漫游的活动，并在其移动时计算更新的位置。当模型执行任务时，可以测量网络内不同单元的活动模式。每个单元的活动都可以表示为一种放电模式，类似于大脑中神经元的放电模式。

在之前的几项研究中，研究人员报告说，他们的模型产生的单元的活动模式非常模仿网格细胞的放电模式。这些研究得出的结论是，类似网格单元的表示自然会出现在任何经过训练来执行路径集成任务的神经网络中。

然而，麻省理工学院的研究人员发现了截然不同的结果。在对超过 11,000 个经过路径整合训练的神经网络进行分析后，他们发现，虽然近 90% 的神经网络成功学习了该任务，但这些网络中只有约 10% 生成了可归类为网格细胞状的活动模式。其中包括即使只有一个单元也能获得高网格分数的网络。

麻省理工学院团队表示，早期的研究更有可能产生类似网格细胞的活动，只是因为研究人员在这些模型中建立了限制。

“早期的研究表明，如果你训练网络进行路径整合，你将获得网格单元。我们发现，相反，你必须做出一长串参数选择，我们知道这些参数与生物学不一致，然后在这些参数的一小部分中，你就会得到想要的结果，”谢弗说。

更多生物模型

早期研究中发现的限制之一是研究人员要求模型将速度转换为独特的位置，由与位置单元相对应的一个网络单元报告。为了实现这一目标，研究人员还要求每个位置细胞仅对应一个位置，这不是生物学位置细胞的工作方式：研究表明，海马体中的位置细胞可以对多达 20 个不同的位置做出反应，而不仅仅是一个。

当麻省理工学院的团队调整模型，使位置细胞更像生物位置细胞时，模型仍然能够执行路径整合任务，但它们不再产生类似网格细胞的活动。当研究人员指示模型生成不同类型的位置输出（例如具有 X 轴和 Y 轴的网格上的位置，或相对于起始点的距离和角度的位置）时，类似网格细胞的活动也消失了。

“如果你要求这个网络做的唯一事情就是路径整合，并且你对读出单元施加一组非常具体的、非生理的要求，那么就有可能获得网格单元，”菲特说。“但是，如果放松这个读出单元的任何一个方面，就会严重降低网络生成网格单元的能力。事实上，通常他们不会这样做，尽管他们仍然解决了路径整合任务。”

因此，如果研究人员不知道网格单元的存在，并引导模型产生它们，它们就不太可能作为模型训练的自然结果出现。

研究人员表示，他们的研究结果表明，在解释大脑神经网络模型时需要更加谨慎。

“当你使用深度学习模型时，它们可以成为一种强大的工具，但在解释它们并确定它们是否真正做出从头预测，甚至揭示大脑正在优化的内容时必须非常谨慎，”菲特说。

伦敦大学学院定量神经科学教授肯尼思·哈里斯 (Kenneth Harris) 表示，他希望这项新研究能够鼓励神经科学家在阐述神经网络和大脑之间的类比所显示的内容时更加小心。

“神经网络可以成为有用的预测来源。如果你想了解大脑如何解决计算问题，你可以训练一个网络来执行它，然后测试大脑以相同方式工作的假设。无论这个假设是否得到证实，你都会学到一些东西，”哈里斯说，他没有参与这项研究。“这篇论文表明，‘事后预测’的威力并不大：神经网络有很多参数，因此让它们复制现有的结果并不令人惊讶。”

麻省理工学院的研究人员表示，当使用这些模型来预测大脑如何工作时，在构建模型时考虑现实的、已知的生物学限制非常重要。他们现在正在研究网格细胞模型，希望能够更准确地预测大脑中网格细胞的工作方式。

“深度学习模型将使我们深入了解大脑，但前提是你将大量生物学知识注入到模型中，”科纳说。“如果你使用正确的约束，那么模型可以为你提供类似大脑的解决方案。”

该研究由海军研究办公室、国家科学基金会、西蒙斯基金会通过西蒙斯全球大脑合作组织以及霍华德休斯医学研究所通过学院学者计划资助。Mikail Khona 得到了 MathWorks 科学奖学金的支持。

(Reprinted with permission of MIT News http://news.mit.edu/)