取样不对,导致结果不同。
所有跟贴·加跟贴·新语丝读书论坛
送交者: 中部 于 2012-03-04, 11:35:14:
回答: 据说是校勘学专家,复旦古籍所苏杰 由 龙灯 于 2012-03-04, 10:33:32:
取样不对,导致结果不同。这么长的句子不可能有相似性。就像我们用DAN 的片段来查找,太长的序列就不可能找到。每减少一个就能增加很多的机会。
只要把中文的全文放到微软的word里,用查找功能就能找到相似的词组。但是如果用这种长句就不可能有甚至一个相似的机会。
所有跟贴:
加跟贴