当百度上线某个算法的时候都可借助历史趋势数据或网站监控的一些功能来了解这些算法对网站带来的影响。
建议确定好一个主要的领域内页不收录原因来了解这些算法对网站带来的影响。
建议确定好一个主要的领域且将其他领域的内容robots掉屏蔽搜索引擎抓取且不再参与搜索引擎排名;
或对其他领域的内容进行删除并将删除的内容URL在百度搜索资源平台提交404确保网站无恙。
可以对应每一个聚合页的主题进行审查确保聚合页下内容都是针对当前聚合页主题所延展的相关内容。
通过内容相似度计算的方式将网页内的主体文本进行提取计算。得出当前聚合页的主题与内容的相似度得分。
并通过实际观察确保相似度得分在哪个值上是可以解决搜索用户需求的。
针对搜索调取的内容相关进行大幅度提升从而提升用户体验度。
利用相似度判断方式让编辑协助完成(所计划的相似度得分值)聚合页的内容撰写工作。
如最终还是无法确保满足用户需求的建议删除或者robots操作。
将更多品类的内容进行搜索整理从而提升聚合页下内容整体的丰富度前期要包管相关性。
其次可将聚合页关键词进行分类。
例如:爬虫抓取、爬虫算法、搜索引擎爬虫、baiduspider被认为是一类聚合页。
当内容为空或少于X条时可以通过扩展调取的维度进行补全。
另外网络营销推广可以通过扩展调取的维度进行补全。