观察量和控制变量选得不好,标准也就定得不好。SAE Level 4自动驾驶标准,就是没有选好观察量和控制变量。
而测试其他人工智能技术以及更广泛的科学实验,也需要选好观察量和控制变量。这里就涉及到很多通用性语言智力、逻辑智力、和数学智力。
研究自由意志、人类直觉思维、应对熵定律的各种方法、诡辩分析和综合前述各方面的新逻辑体系,也涉及很多通用性语言智力、逻辑智力、和数学智力。
这些通用性智力,既有相当难度,又是不同专业共同需要的,就是测试通用性智力的研究生考试的很好题材。
我还设计了无人汽车的四维测试标准,包括几百个典型的类型作为参考范例。
如果Alphabet/Waymo愿意open-source他们的全部模拟测试库,别人就可以分析他们的模拟测试库是否合理、有效,我也可以告诉他们我的测试标准里有多大部分他们没有测试到。估计大部分都没测试到。
无人汽车涉及公共安全,所以Alphabet/Waymo有更大的责任open-source他们的全部模拟测试库。