
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
模型应用在学习计算机互联网技术的时候是一个非常便捷的方法,而今天我们就通过案例分析来了解一下,机器学习模型应用都有哪些技巧。
1.缺失值处理
特征预测建模法:回到我刚才提到的关于年龄和健康评估分数的例子,我们可以建立年龄和健康评估得分之间的关系进行建模,然后使用这个模型来找出给定年龄的预期健康评估分数。这可以通过多种技术来实现,包括回归分析、方差分析等等。
K近邻填补法:使用K近邻填补法,缺失数据用另一个相似样本的值来填充,对于那些不知道的,就用距离函数(即欧几里得距离)来确定K近邻的相似度。
删除行:后,你可以删除该行。通常不建议这样做,但当你有大量的数据要处理时,这样的做法是可以接受的。
2.特征工程
将DateTime变量转换为一周中的某一天、一年中的某一个月等等。
为变量进行分桶操作。
组合多个特征和/或值来创建新特征。
3.特征选择
特征重要性法:一些算法,如随机森林或XGBoost,允许你确定哪些特征在预测目标变量的值时是“重要”的。通过快速创建其中的一个模型并进行特征重要性的处理,你将了解到哪些变量比其他变量更为有用。
降维法:作为常用的降维分析技术之一,主成分分析(PrincipalComponentAnalysis,PCA)采用了大量的特征,并使用线性代数将它们约简到较少的特征。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!更多内容请在707945861群中学习了解。