举个例子，制定好的自动驾驶标准，需要选择有效的观察量和控制变量

观察量和控制变量选得不好，标准也就定得不好。SAE Level 4自动驾驶标准，就是没有选好观察量和控制变量。

而测试其他人工智能技术以及更广泛的科学实验，也需要选好观察量和控制变量。这里就涉及到很多通用性语言智力、逻辑智力、和数学智力。

研究自由意志、人类直觉思维、应对熵定律的各种方法、诡辩分析和综合前述各方面的新逻辑体系，也涉及很多通用性语言智力、逻辑智力、和数学智力。

这些通用性智力，既有相当难度，又是不同专业共同需要的，就是测试通用性智力的研究生考试的很好题材。

我还设计了无人汽车的四维测试标准，包括几百个典型的类型作为参考范例。

如果Alphabet/Waymo愿意open-source他们的全部模拟测试库，别人就可以分析他们的模拟测试库是否合理、有效，我也可以告诉他们我的测试标准里有多大部分他们没有测试到。估计大部分都没测试到。

无人汽车涉及公共安全，所以Alphabet/Waymo有更大的责任open-source他们的全部模拟测试库。