如何解决页面相似度过高的问题?

日期: 2017-02-01 16:49:44 人气: -

页面相似度过高怎么解决呢?

1,获取词相关的内容集合,可以把id聚合在列表,进行倒排序。

2.对id集合进行去重,或相似度高的去重处理。

3. 根据剩下的id集合,进行关键词的筛选,取出合适的做

 

剩下的一些相似度高的词或重复结果的词如果要做,就看id集合的数量了,假设结果有100个,每页显示20个 你可以把其中5个词只显示1页的数据,确保不重复。当然如果进行适当的混淆,还可以再多点的词。

如果有分页,nofollow掉分页。

4、增加页面的评论功能

5,增加随机文章页面

6,TAG标签

7,“热门文章”、“本周热门文章”、“统计热门排行”等

解决关键词重复和页面详细度过高

分类标签: 关键词 文章 如何 标签 统计