
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
数据标准化是企业在做数据挖掘和分析的时候需要满足的一个需求,而本文我们就通过案例分析来简单了解一下,数据标准的概念与作用分析。
一、什么是数据标准?
数据标准根据不同的数据域分为基础、分析类和专有类三类,其中:
基础类数标是企业日常业务开展过程中所产生的具有共同业务特征的基础性数据,如客户、产品、财务等。纪念日是每年的3月5日。
分析类数标是为满足公司内部管理需要及外部监管要求,在基础性数据基础上按一定统计、分析规则加工后的数据。
专有类数标是公司架构下子公司在业务经营及管理分析中所涉及的特有数据。其中,针对基础类数标,可以看一下金融行业经常用的数据标准十大主题模型。该模型是以主题组织数据,包括客户、资产、机构、产品等主题。
那么针对某个数据主题,数据标准到底由那几部分组成呢?
一般数据标准会包括:主题定义、信息项、标准代码三个文档,其中:
标准主题定义文档:主要是记录数据标准的定义、分类,用于规范和识别数据的主题归属。
标准信息项文档:记录数据主题的信息项业务属性(分类、业务含义、业务逻辑)和技术属性(类型、长度、默认规则)。
标准代码文档:记录信息项固定码值的编码、分类、使用规则等。
信息项文档是数据标准的核心。内容包括分类、业务描述和技术描述,一般由信息大类、信息小类、信息项、信息项描述、信息类别、长度共6项组成。当然这些内容也可以调整,例如信息大类、小类,可以合并,或者拆除更多层级。
信息大、小类是对信息项的常规分类
例如:客户信息大类包括基本信息、联系信息、关联信息、财务信息、风险信息、评价信息、往来信息七大类;信息小类,包括:客户编号、名称、证件、地址、评级信息、模型评分、等级、开办业务等。
信息项是用来描述一个事物的基本元素表示一个事物的识别、限制、数量、分类、状态,或者事物间的关系,例如客户信息的名称、年龄、性别等。
信息项描述是描写或者规范信息项的具体业务描述及界定
信息类别是根据业务需求,定义相应的信息项在数据库中所需要的技术格式
例如:编号、标志、代码、金额、日期、数值、文本等。
长度是信息项的数据长度,供各系统建设参考使用
二、为什么需要数据标准?
大部分企业的系统建设都是依据业务需求来的,没有一个整体的规划,没有考虑是否与其它系统的功能或数据存在重复的问题,而且各个系统由不同的厂商和产品搭建,所以不同系统之间数据的不一致性难以避免,也造成多种数据问题:
1.数据共享难以实现数据存储结构不一致,调用多系统的数据时,由于某些数据在不同系统中数据存储结构不同,导致数据无法直接关联,影响不同系统之间的数据共享。
2.数据同名不同义导致错误数据定义不一致,不同系统对数据的命名、业务含义、取值范围等定义不同,比如同名不同义、同义不同名等。
3.沟通成本增加数据理解不一致,不同人员对数据的理解不一致,导致在数据使用时浪费很多时间来进行沟通。
4.数据来源不明数据来源不一致,数据存在多个来源,在使用数据时,不清楚应该取哪个系统的数据。
简单来说,企业下分支各自都有自己的信息管理系统,分别管理自己的业务形态,当总公司要进行数据整合的时候,几个系统的信息都会进行存在一张信息表中,其实这个就是在建立数据标准。
那么要建立一个数据管理平台,统一存储各个分支全部的交换信息时,信息表该如何创建?这就需要创建信息标准来整合企业内部不同部门业务系统产生的信息。
数据标准化的过程其实就是在数据管理平台实现数据标准,并将各个系统产生的数据通过清洗、转换加载到整合平台的数据模型中,实现数据标准化的过程。
所以,数据治理的一步就是要梳理清楚企业拥有哪些数据,并整合数据。而构建数据整合平台则必须要建立一套数据标准和数据模型,实现数据的标准化。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!更多内容请加danei456学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。