在大数据和移动互联网时代每个使用移动终端的人都在不断地生成数据并且作为互联网服务提供的产品数据不断累积。像人工智能这样的数据通常表现出更客观和理性的一面。数据可以让人们更直观更清晰地了解世界。数据还可以指导人们更合理地做出决策。
数据分析过程主要分为五个关键环节:明确的数据分析目的清晰的数据源和数据口径数据处理数据分析和输出。
首先明确数据分析目的
在完成之前任何事情都是有目的的数据分析也是如此。在进行数据分析之前我们必须首先明确数据分析的原因。用户要求和场景三因素反汇编方法阐明了数据分析的目的。
1.用户
这里提到的用户是指数据分析内容还是结果给谁?这里的目标用户主要分为三类:您自己内部业务部门和外部客户。这里主要分析后两者。
内部业务部门:
这些用户通常通过制定不同的策略来改进公司的某些指标可以是营销部门运营部门或维护部门。它们通常指导企业内部大量数据的积累但不知道如何使用它以及如何通过数据分析形成有效的决策。
外部客户:
这些用户通常没有某个领域或多个领域的行业数据并希望通过这些数据了解他的用户或市场而且您的公司会发生这样的数据。在这种情况下数据值被实现并形成外部数据分析输出可以更好地了解外部用户的市场。对您而言它还可以通过数据形成实现价值并为企业带来利益。
2需求
您的用户数据分析问题创建者进行数据分析。他们希望通过数据分析找到问题或希望改进某个业务指标。在进行数据分析之前需要了解这些。只有了解要求才能制定更合理的数据分析思路(稍后将在数据分析方法中进行介绍)。
3.场景
场景更多地反映在数据分析的场景中。例如业务部门想知道注册过程中用户丢失的原因。那么这就是问题情景。有必要根据场景定义问题整理数据分析思路并选择数据分析方法。
第二明确数据来源和数据口径
1.数据源
获取数据有三种主要方式。第一个是通过一些基于前端页面的数据收集工具获得的例如GrowingIO等数据采集产品;第二种是通过产品设计过程中的数据掩埋。可以进行简单的提取。该方法的前提是产品规划阶段的数据采集已提前准备好;第三是如果在前一阶段没有功能掩埋和可视化的采集工具则无法获得数据。找到研发团队通过后台脚本或技术开发获取数据。
2数据口径
数据口径这是定义某个数据指标的含义。对于简单的板栗不同的产品或不同的领域将对用户流失指标的定义不同。对于普通的电子商务产品用户不会在三天内登录或购买丢失但对于奢侈品电子商务在没有登录或购买的情况下在几天内算作用户损失是不合理的。
为了清晰的数据口径有必要结合数据分析任务提议者和特定业务场景的要求。定义清晰的数据口径对于后续数据处理和数据分析至关重要。
三数据处理
数据处理阶段的主要任务是数据清理数据完成和数据集成。
1数据清理
如果找到数据中的异常值例如连续几天处理用户登录数据如果一天内登录的数量远远超过正常值SEO排名服务如果一天内登录的数量远远超过正常值则需要进行分析当天是否有重要的营销活动或收集数据时。错误通过异常值不仅可以找到数据收集方法的问题还可以通过异常值找到SEO数据分析的目标。例如信用卡欺诈分析是查找异常数据的方法。
2数据完成
解决数据丢失问题的一种方法是根据数据前后的关系填写平均值另一种方法是直接选择丢失的记录而不用于数据分析。这两种方法各有利弊建议结合具体问题分析具体问题。