
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
随着互联网的不断发展,越来越多的企业都引入了大数据技术应用,下面我们就通过案例分析来简单了解一下,数据挖掘建模步骤都有哪些。
1.数据准备
选择数据的标准,一是相关性,二是可靠性,三是时效性,要选择具代表性、有特征的数据,而不是动用全部企业数据。
通过数据样本的精选,不仅能减少数据处理量,节省系统资源,而且能通过数据的筛选,使想要反映的规律性更加突显出来。
2.模式分析
模型构建的前提是在样本数据集中发现模式,在样本抽取完成并经预处理后,接下来要考虑的问题是:本次建模属于数据挖掘应用中的哪类问题(分类、聚类、关联规则或者时序模式),选用哪种算法进行模型构建?
在目标进一步明确化的基础上,我们就可以按照问题的具体要求来重新审视已经采集的数据,看其是否适应挖掘目标的需要。
3.模型构建
确定了本次建模所属的数据挖掘应用问题后,还需考虑具体应该采用什么算法,实施步骤是什么?
这一步可谓是数据挖掘工作的核心环节,模型构建是对采样数据轨迹的概括,它反映的是采样数据内部结构的一般特征,并与该采样数据的具体结构基本吻合。
预测模型的构建通常包括模型建立、模型训练、模型验证和模型预测4个步骤,但根据不同的数据挖掘分类应用会有细微的变化。
4.模型评价
模型效果评价通常分两步:
一步,直接使用原来建立模型的样本数据来进行检验。
二步,另找一批反映客观实际的、规律性的数据。
假如进行模型评价时一步都通不过,那么所建立的决策支持信息价值就不太大了。
一般来说,模型评价在一步应得到较好的反馈,从而说明我们确实从这批数据样本中挖掘出了符合实际的规律性。
数据+工具+方法+目标+行动=价值。
【免责声明】:本内容转载于网络,转载目的在于传递信息。文章内容为作者个人意见,本平台对文中陈述、观点保持中立,不对所包含内容的准确性、可靠性与完整性提供形式地保证。请读者仅作参考。更多内容请加danei0707学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。