_____1_____2_____3_____4_____5_____6_____7_____8
我上面画的是一个尺子. 在每一个数字的地方有一个sensor. 每个sensor的输入是盖住和不盖住两个状态. 如果实测的长度盖住3, 没盖住4, 那我们说这个长度是3.5+-0.5.
由于每个sensor本身的尺寸很小, 如果被测的长度位于4和5中间, 测一万遍都会得出同样的结果, 4盖住, 5不盖住. 结果是4.5+-0.5. 同一个数字, 平均不平均都没区别.
但是如果被测的长度正好在4上, 由于sensor本身有大小, 可能有时候输出盖住, 有时候输出不盖住, 测量会有两种结果, 3.5+-0.5 和4.5+-0.5. 由于有了随机性, 测一万次可以平均一下, 这样得出的结果可能是3.8+-0.5, 无论如果, 比不平均的结果要更接近真值, 但是误差还是+-0.5
上面都是假设所有sensor都是可靠的, 不会出错. 假定这些sensor有一定小的可能性出错, 而且出错的原因是无偏的随机的, 那测一万遍的结果可能是五花八门, 从1到7都有. 如果把它们都平均一下, 还是会得出比如出3.9+-0.5这样的结果来的. 所以平均只有在有随机因素的时候才有用, 最好的结果不超过最小刻度.
那么那个公式

是什么意思呢?
这个公式只是说平均值的涨落小于单个值的涨落. 就是说平均值本身波动小. 至于平均值是不是更接近于真值, 有多接近, 见上面的分析, 大多的时候跟这个sigma无关. 除非sigma远远大于最小刻度.
最后把这个最小刻度推广一下. 最有操作意义的量不是accuracy, 也不是precision, 而是resolution, 就是最小分辩率. 用上面的尺子, 如果物体长度变化在4 和5 之间, 测量结果是不会有任何变化的, 也就是说, 最小分辩率是1. 所以对其它测量, 用resolution这个概念.
如果测量仪器本身不能输出任何1以下的数据, 无论用什么先进的方法处理数据, 都不能产生1以下的信息来.
这最后一句话应该是007所迷失的 "科学态度"中的一方面.