数据分析的基本方法
数据分析有法可循,在分析数据时使用分析方法可以快速有效地分析数据,从数据中获取信息。常用的分析方法有对比法、拆分法、交叉法、降维法、增维法、指标法和图形法,根据业务场景选择一种或一种以上的分析方法可以让分析更加高效。
1对比法
对比法是最基本的分析方法也是数据分析的“先锋军”,分析师在开展分析时首先使用对比法,可以快速发现问题。对比法分为横向和纵向两个方向。
横向对比是指跨维度的对比,比如在分析企业销售业绩的时候,将不同行业的企业销售业绩一起进行对比,这样可以知道某家企业在整个市场的地位。如中国的500强企业排行榜单,就是将不同行业的企业产值进行对比。
纵向对比是指在同一个维度的对比,比如基于行业为维度,钢铁行业的企业排行榜单;比如基于时间为维度,将今天的销售业绩和昨天、上个星期同一天进行对比,可以知道今天的销售业绩的情况。
例:小李是某天猫运营,刚接手一家新网店,欲确定该店铺的主营品类,已知该店铺经营A,B,C,D四个品类。
解:通过对比A,B,C,D四个品类的天花板,要做市场规模则选择天花板高的品类,要便于生存则选择天花板低的品类。
表2-1
图2-1
2拆分法
拆分法是最常用的分析方法之一,在许多领域应用非常广泛,杜邦分析法就是拆分法的经典应用。拆分法是将某个问题拆解成若干个子问题,通过研究该若干子问题从而解决问题。比如在研究销售业绩下降问题时,可以将销售业绩问题拆分成转化率、客单价和访客数这三个子问题,通过分析这三个子问题从而解决销售业绩问题。
解:销售额下降的问题可拆分成三个子问题,分别是转化率、客单价和访客数的变化,通过表2-2结合对比法发现主要是访客数的变化引起的销售额大幅下降。可再进一步拆分访客数,访客数可分为付费访客数和免费访客数,对问题的原因进一步剖析,直到找到问题的根源。
图2-2
3排序法
排序法是基于某一个度量值的大小,将观测值递增或递减的排列,每一次排列只能基于某一个度量值。排序法是从对比法中衍生的一种常用方法,百度搜索风云榜、淘宝排行榜等业内知名榜单就是重度采用排序法的产品,通过排序后的榜单,让用户快速获取目标价值信息。
4交叉法
交叉法是对比法和拆分法的结合,是将有一定关联的两个或以上的维度和度量值排列在统计表内进行对比分析,在小于等于三维的情况下可以灵活使用图表进行展示。当维度大于三维时选用统计表展示,此时也称之为多维分析法。比如在研究市场定价时,经常将产品特征和定价作为维度,销售额作为度量值进行分析。
5降维法
降维法是在数据集字段过多时,分析干扰因素太多,通过找到并分析核心指标可以提高分析精度,或者通过主成分分析、因子分析等统计学方法将高维转变成低维。比如在分析店铺数据时,根据业务问题的核心提取主要的两到四个核心指标,进行分析。
6增维法
增维法是在数据集的字段过少或信息量不足时,为了便于业务人员分析,通过计算衍生出更加直观的指标。比如在分析关键词时,将搜索人气除以商品数量得到一个新的指标,定义为关键词的竞争指数。
7指标法
指标法是分析的基本方法之一,通过汇总值、平均值、标准差、等一系列的统计指标研究分析数据。指标法更适合用于多维的数据。
8图形法
图形法是分析的基本方法之一,通过柱形图、折线图、散点图等一系列的统计图形直观地研究分析数据。图形法适合用于低维的数据。
图2-3是基于售价分组后绘制的直方图,可以直观地观察各个价格区间包含商品的个数,商品售价分布主要集中在[118,588],[1058,1998]两个区间。
图2-3
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请通知我们,一经查实,本站将立刻删除。