net下文本相似度算法余弦定理和simhash浅析及应用