帮助机器理解物理法律以了解对象如何表现的直觉

麻省理工学院本发明的模型通过在模拟中的物体以意想不到的方式移动的情况下，例如在墙壁后面滚动而不会在另一边再出现时，通过注册“惊喜”来了解对一些基本的“直观物理学”的理解。

人类早点了解物理现实的法律。例如，婴儿持有对象应该如何相互移动和互动的期望，并且当他们做出意外的事情时会出现惊喜，例如在一个手中消失的魔法伎俩。

现在，MIT研究人员设计了一种模型，它展示了一些关于物体如何表现的基本“直观物理学”的理解。该模型可用于帮助构建更智能的人工智能，然后提供信息，以帮助科学家了解婴儿认知。

该模型称为Adept，观察对象在场景周围移动，并根据其基础物理学来预测对象应该如何表现。在跟踪对象的同时，模型输出在每个视频帧的信号，这些帧相关的信号与“惊喜” - 信号越大，令人惊讶。如果一个物体曾经显着地不匹配模型的预测 - 通过，在一个场景中解释，消失或传递 - 它的惊喜水平将飙升。

为了响应显示物体以物理卓越和难以置信的方式移动的视频，模型注册了人类匹配的匹配水平，这些匹配由人类报告的人看待相同的视频。

“到了时间婴儿是3个月大，他们有一些概念，这些物体不眨眼，也不能相互迁移或传送，”研究科学家首次作者Kevin A. Smith说：大脑和认知科学部（BCS）和脑部，思想和机器中心的成员（CBMM）。“我们想捕捉并正规化该知识，将婴儿认知构建成为人工智能代理人。我们现在在人类的方式靠近人类可以挑选出基本难以禁要或合理的场景。“

加入史密斯本文是一首第一名作者，是凌杰美梅，电气工程与计算机科学系的本科生，而BCS研究科学家顺宇瑶族;嘉君吴博士; CBMM调查员Elizabeth Spelke; Joshua B. Tenenbaum，一位计算认知科学教授，以及CBMM，BCS和计算机科学和人工智能实验室（CSAIL）;和CBMM调查员Tomer D. Ullman Phd'15。

不匹配的现实

Adept依赖于两个模块：一个“逆图形”模块，用于从原始图像捕获对象表示，以及从可能性分布中预测对象的未来表示的“物理引擎”。

逆图形基本上从像素输入基本上提取物体的信息，姿态，姿势和速度 - 从像素输入。该模块将视频帧捕获为图像，并使用逆图形从场景中的对象中提取此信息。但它不会在细节中陷入困境。adep仅需要每个形状的一些近似几何形状到功能。部分地，这有助于将模型概括为新对象的预测，而不仅仅是那些它培训的人。

“如果物体是矩形或圆圈，或者是卡车或鸭子并不重要。娴熟只是看到了一个有一些位置的物体，以某种方式移动，让预测成为“史密斯说。“同样，年轻的婴儿似乎在做物理预测时，似乎没有像形状那样的一些性质。”

这些粗略对象描述被馈送到物理发动机 - 模拟物理系统的行为，例如刚性或流体体，并且通常用于电影，视频游戏和计算机图形。研究人员的物理引擎“及时推动了对象，”Ullman说。这会产生一系列预测，或者“信仰分布”，对于下一帧中的这些对象会发生什么。

接下来，模型观察实际的下一帧。再次捕获对象表示，然后它从其信仰分布中对准预测对象表示之一。如果对象遵守了物理定律，这两个表示之间不会存在多大不匹配。另一方面，如果物体令人难以置信的话 - 说，它从墙壁后面消失 - 将有一个重大错配。

然后擅自从其信仰分布中重建，并注意到物体简单地消失的非常低的概率。如果有足够低的概率，则该模型将重大“惊喜”作为信号尖峰。基本上，惊喜与发生事件的可能性成反比。如果概率非常低，则信号尖峰非常高。

“如果一个物体落后墙壁，你的物理引擎保持了一个信念，即物体仍然在墙壁后面。如果墙壁下降，没有什么在那里，有一个不匹配，“Ullman说。“那么，模型说，”我的预测中有一个对象，但我没有看到任何东西。唯一的解释是它消失了，所以这令人惊讶。“

违反期望

在发展心理学中，研究人员犯了“违反期望”的测试，其中婴儿是对视频的对。一个视频显示了一个合理的事件，对象遵守世界如何运作的预期概念。除了物体以某种方式违反期望的方式，其他视频是相同的。研究人员经常使用这些测试来测量婴儿在发生难以置信的行动之后看婴儿看起来有多长。他们凝视的时间越长，研究人员假设，它们可能对刚刚发生的事情感兴趣。

对于他们的实验，研究人员根据经典发展研究创造了几种情况，以检查模型的核心对象知识。他们雇用了60名成年人，观看64个识字物理合理和身体难以置信的情景的视频。例如，对象将在墙壁后面移动，当墙壁下降时，它们仍然会在那里或者他们会消失。参与者在各种时刻评定了令人惊讶的是，在0到100的范围内。然后，研究人员对模型显示了相同的视频。具体而言，该方案检查了模型捕获持久概念的概念的能力（对象没有出现或没有原因消失），连续性（对象沿着连接的轨迹移动），并且稳定性（对象无法彼此移动）。

熟练的匹配人类尤其适用于物体在墙壁后面移动并消失后消失的视频。有趣的是，该模型还匹配了人类对人类不感到惊讶但也许应该是的令人惊讶的水平。例如，在一个以特定速度移动的物体在墙壁上消失并立即出现另一边的视频中，当它在墙壁后面时，物体可能会急剧上升，或者它可能已经传递到另一边。一般来说，人类和擅长既不肯定是否这项事件是不是令人惊讶。研究人员还发现了传统的神经网络，从观察中学习物理学 - 但没有明确代表物体 - 在令人惊讶的场景中令人惊讶地令人惊讶的是，他们的令人惊讶的场景通常不会与人类对齐。

接下来，研究人员计划进一步深入研究婴婴儿如何观察和解世界，目的是将任何新发现纳入其模型。例如，研究表明，当物体以某种方式完全改变时，婴儿实际上并不很有惊讶 - 例如，如果卡车在墙上消失，但再次成为鸭子。

“我们希望看到还需要建立什么，以了解世界更像婴儿，并形式化我们对心理学的了解，以建立更好的AI代理商，”史密斯说。