
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
大数据技术应用是目前许多企业都在学习和应用的一个互联网新技术,而本文我们就通过案例分析来简单了解一下,大数据数据指标规范与问题分析。
一、数据指标规范
元数据在指标管理、模型设计、数据质量和成本治理四个领域都发挥着作用,而这些领域构成了数据中台OneData数据体系。从今天开始,我将带你逐一了解元数据在上述领域的应用,先是指标管理。指标是一种特定类型的元数据,公司的运营会围绕它进行工作,可以说,它是业务和数据的交汇点。指标数据能不能用,会影响他们的日常工作。
二、指标混乱现状
同名不同径,同径不同名。口径不清晰,口径有错误。命名难理解,计算不易懂。来源不清晰,同部不同径。
1、相同指标名称,口径定义不同。我开篇说的就是这个问题,不同的部门对相同的“新用户销售额”,因为口径定义的差别,导致指标数值的不一致。而这种情况是指标管理中容易出现的情况。口径不一致,数据也就没办法横向对比,失去了数据辅助商业决策的意义。
2、相同口径,指标名称不一样。这种情况与上面相反,比如发放优惠券是电商常见的促销手段,现在你有两个数据产品:一个是经营大脑,主要展示的是企业日常经营活动健康度的核心指标,它有一个指标叫“优惠券抵扣金额”;一个是市场360,主要是展示市场活动效果衡量的指标,它也有一个指标叫“优惠券消耗金额”。其实,两者的口径定义并没有区别,但是指标名称不同,这会让使用指标的人疑惑,是不是同一个指标,计算逻辑是否一致?数据是否可以横向对比?
3、不同限定词,描述相同事实过程的两个指标,相同事实部分口径不一致。
4、指标口径描述不清晰。在梳理过程中,我们还发现,有些报表上的指标口径描述的比较笼统。比如“关单金额”,口径描述“关闭订单的金额”。不同人的理解可能不一样,有的人会认为是支付成功后关闭订单;也有可能是支付完成前,取消订单。描述不清晰,就会让人们对数据的理解产生歧义。
5、指标口径描述错误。在流量分析数据产品中,有“7日uv”这个指标,口径的定义是7日内日均uv。根据口径描述的计算逻辑,应该是近7日,每日uv相加除以7取平均值。显然,这个定义在业务场景中是有问题的,正确的7日uv的口径定义应该是7日内有登录过,去重的用户数。
6、指标命名难于理解。我们在梳理促销业务过程的指标时,有一个数据产品的指标名称是“ROI”,口径定义优惠券销售额/优惠券成本。ROI其实是投资回报率的简称,在电商业务场景中,除了优惠劵,商品降价促销都可以计算ROI,所以比较好的命名应该是(商品|类目|通用)优惠劵ROI。所以,指标命名不规范的话,从指标名称中很难看出指标描述的业务过程。
指标数据来源和计算逻辑不清晰。如果指标数据来源不清楚,一旦这个指标数据异常,就很难去做溯源。另外,有些指标的计算逻辑比较复杂,仅仅凭借业务口径一段描述,使用指标的人还是无法理解这个指标的计算逻辑,这个时候就需要有一些伪码或者SQL描述。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!更多内容请加danei0707学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。