当前位置: 首页 > SEO学院SEO知识

夜间SEO培训SEO数据分析II简介-如何改善网站收货

来源:未知 浏览量:120次

页面质量是否通过

前一篇文章已经提到包含率作为指标。许多网站都懒得做这个指标。 “我没有看到网站数据!”事实上没有这个指标很多工作都无法完成。识别数据中的问题阳江网站优化很多工作都无法完成。识别数据中的问题使用数据指导解决方案并分析数据验证工作。我最近看了《深入浅出数据分析》这本书感觉很好而且数据分析的方法非常生动。建议对数据分析感兴趣的学生可以购买本书。任何数据分析包括四个步骤:目标 - >分析 - >评估 - >决策。

目标:我们希望看到如何包含该网站以及是否有机会改进SEO。

分析:什么是好的和什么是坏的计算是什么它是通过一些指标来衡量的?是否包含网站过于笼统是否应该细分为每个页面的包含?

评价:所以我们需要以下一些数据

网站的页面级别关系

来自不同级别页面的SEO流量

每个级别页面的状态是什么

可以从Google Analytics中过滤掉SEO流量的比例。

页数可以从数据库中获取也可以通过机车或自制的小脚本来获取统计数据。

包含率可用于通过工具搜索获取的页面并且机车也可用。

问题立即突出显示!

1 + 2目录页面带来了大量流量包含率不是很好并且包含流量改进突破的优化就在这里!

有很多产品页面包含不是很好但流量有限。除了包含问题之外页面内容也存在问题。我将在本文中不管它。

决定:我们的结论是立即采取措施优化目录页面的包含。

看到这一点似乎最初的目标是:“通过优化包容来改善流量”

它已演变成一个新目标:“如何增加目录页面的数量”

你能通过数据分析再次做SEO吗?

**是!

让我们再回到目标 - >分析 - >评估 - >决策过程

目标:增加目录页面的数量

分析:通过与包含本文相关的两个因素我们需要检查爬网程序是否已抓取网页林芝网站优化我们需要检查爬网程序是否已抓取网页并且未传递网页的质量。

关于爬行动物的情况我们需要分析日志以确定。因此我们从日志中分割出一系列数据以查看该页面是否真的已被抓取。

2.由于页面质量似乎很难衡量我们可以使用相同的模板:

已爬网的页数/已爬网和包含的页数

评估模板页面质量对包含的影响。如果包括被爬网的页面则至少仍然识别该组页面的内容搜索引擎。 (实际情况比这复杂得多由于质量问题可能会在质量后删除但它比任何参考都要好对吧!)

评估:(敏感信息由数字代替都是真实数据)

我们来看看爬虫日志。我们可以通过shell脚本进行分析。

已爬网目录的总数约为13,000次

非重复目录爬网的数量约为5500次

通道A下的目录至少被抓取一次100%目录B通道抓取也很好70%被抓到至少一次。

其余频道下的目录已被抓取覆盖率低于30%

不要以为这个结果非常惊人。事实上很多网站都会面临这样一个可怕的问题。只要您继续细分细分和细分数据您将始终观察到一些线索。

关于日志分析不要迷信任何日志分析软件它适用于懒人自制脚本+ Excel为王你可以拆分并显示你想要的任何数据当然甚至Excel都不能。

然后我们计算了最常捕获的通道A和通道B以及目录页面的包含率

频道A和B非常令人放心表明页面质量还可以但其余情况更令人担忧。

决定:通过上述数据评估我们得出以下结论。

页面质量不是包含的原因。

通道A和B的捕获量异常高。通过调查结果是它是主页上的目录页面其显示了频道A下的所有目录页面并且主页具有整个站点的最高权重。 B通道比其他通道具有更强的外部资源其重量非常高。

除了A林芝网站优化其重量非常高。

除了AB通道外其他渠道的爬行也不容乐观入口的爬行过小过深从而影响包容性。

显然从电台的角度来看频道A太强大了。有必要开展一些“抢劫富人帮助穷人”活动以减少渠道A的捕获量并将其转移到其他渠道。同时您需要为抓取工具提供更多访问抓取渠道页面的权限。

现在问题已经明确我们开始将工作分为两部分:1。提供更多条目2.将资源划分为渠道而不是关注几个渠道。

提供入职工作:

1.将目录页面的URL设置为站点地图。提交到搜索引擎并将其设置为更高的爬网权重。

2.改进面包屑导航并更仔细地划分面包屑以提供更多条目

3.在其他产品中推荐目录页面

资源共享工作:(有些概念:任何页面都可能成为爬虫入口百度爬虫爬行深度有限页面相对于入口越浅被抓取的概率越高。)

展开全部内容