如何解决页面相似度过高的问题?

页面相似度过高怎么解决呢?1,获取词相关的内容集合,可以把id聚合在列表,进行倒排序。2.对id集合进行去重,或相似度高的去重处理。3. 根据剩下的id集合,进行关键词的筛选,取出合适的做 剩下的一些相似度高的词或重复结果的词如果要做,就看id集合的数量了,假设结果......
2017-02-01 16:49:44