当前位置: 首页 > SEO学院SEO知识

夜息SEO培训 小议SEO 的数据分析II –如何改善网站收录

来源:未知 浏览量:260次
夜息SEO培训:小议SEO的数据分析II–如何改善网站收录

距离上一篇SEO的数据分析已经过了好久了最近觉得应该写一些实际点的内容看看SEO到底怎么做SEO。先 明确一些基本点一个网页被收录与否SEO排名服务一个网页被收录与否有两个因素

是否被爬虫爬过

页面质量是否过关

上一篇文章已经提过了收录率这么一个指标很多网站都懒得去 做这个指标“我看看site的数据不就行了!”事实上没有这个指标很多工作就无从下手如何。从数据中发现问题网站优化很多工作就无从下手如何。从数据中发现问题利用数据指导解决方案分析数据验证工作成果改善。了《深度浅出数据分析》这个本觉得不错把数据分析的方法讲得很深刻建议有兴趣的军队数据分析的同学可以买本看看收录。任何数据分析由目标->分析->评估- >决策四个相互作用组成II

目标:我们想看一下网站的收录情况如何在SEO方面是否还有提高的机会网站

分析:收录情况什么算好什么算坏是不是用一些指标 来此?网站的收录情况是不是过多笼统是不是应该分割下多个页面的收录情况?

评估:于是我们需要下面一些数据

网站的页面层级关系

各个层级页面带来的SEO

页面数量可以从数据库获得或者通过火车头或自制小脚本抓取统计数据分析

收录率可以

问题立马凸显!

1 + 2级目录页带来的流量网站优化或者通过火车头或自制小脚本抓取统计数据分析

收录率可以

问题立马凸显!

1 + 2级目录页带来的流量收录率不是很好优化收录的流量提升突破口在此!

产品页面数量很多收录也不是很理想但是带来的流量有限除了收录问题还有页面内容的问题这里中先不管它了培训。进行收录的优化小议

看到这边似乎刚开始的目标:“通过优化收录提升流量”

转化成新的目标:“如何提高目录页面的收录量”

这边能不能再次 通过数据分析的方法进行SEO呢?

**是肯定的!

我们再来重新走一遍目标->分析->评估->决策的过程

目标:提高目录页面的收录量

分析: 通过本文开始的有关收录的两个因素我们需要检查一下网页是否被爬虫爬行过网页的质量是不是过关夜息

1.关于爬虫的情况我们需要分析日志才能确定

夜息SEO培训:小议SEO的数据分析II – 如何改善网站收录

于是我们从

2由于页面质量似乎是一个很难衡量的值于是我们可以用相同模板下的:

已被爬行的页面数量/已被爬行和被收录页面数量

来评估该模板页面质量对收录的的影响 大小。如果被爬的页面都被收录了那至少说明这套页面的内容搜索引擎还算认可。(实际情况远比这个复杂而且收录后也有可能因为质量问题被删除但总比什么参照

没有评估:(敏感信息用编号代替直接真实数据)

先看一下爬虫日志的情况通过Shell脚本我们可以分析出

目录总数被爬行的 次数为13000次左右

不重复的目录爬行次数为5500次左右

频道A下的目录几乎被100%抓取过至少1次频道B的目录抓取也不错有70%被至少抓 过一次

其余频道下的目录被抓取的覆盖率不到30%

不要觉得这个结果很神奇其实很多网站都会面对这样的糟糕问题只要你把数据不断的细分细

关于日志分析不要都是信人的自制脚本+ Excel才是王道可以分开显示出

然后我们统计了一下被抓得得最多的频道A和频道B目录页的收录率

展开全部内容