
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
机器学习是我们在学习人工智能技术的时候需要重点掌握的一些基础知识点,而本文我们就通过案例分析来简单了解一下,机器学习需要掌握哪些算法。
1、学习算法
机器学习算法是一种能够从数据中学习的算法。这里所谓的“学习“是指:“如果计算机程序在任务
T中的性能(以P衡量)随着经验E而提高,则可以说计算机程序从经验E中学习某类任务T和性能度量P。”
2、性能度量
P
为了评估机器学习算法的能力,我们必须设计其性能的定量度量,即算法的精度指标。通常,性能度量P特定于系统正在执行的任务T。
可以理解为不同的任务有不同的性能度量。
对于诸如分类、缺失输入分类和转录任务,我们通常度量模型的准确率(accu-racy)。准确率是指该模型输出正确结果的样本比率。我们也可以通过错误率(errorrate)得到相同的信息。错误率是指该模型输出错误结果的样本比率。
我们使用测试集(testset)数据来评估系统性能,将其与训练机器学习系统的训练集数据分开。
值得注意的是,性能度量的选择或许看上去简单且客观,但是选择一个与系统理想表现能对应上的性能度量通常是很难的。
3、经验
E
根据学习过程中的不同经验,机器学习算法可以大致分类为两类
无监督(unsuper-vised)算法
监督(supervised)算法
无监督学习算法(unsupervisedlearningalgorithm)训练含有很多特征的数据集,然后学习出这个数据集上有用的结构性质。在深度学习中,我们通常要学习生成数据集的整个概率分布,显式地,比如密度估计,或是隐式地,比如合成或去噪。还有一些其他类型的无监督学习任务,例如聚类,将数据集分成相似样本的集合。
监督学习算法(supervisedlearningalgorithm)也训练含有很多特征的数据集,但与无监督学习算法不同的是数据集中的样本都有一个标签(label)或目标(target)。例如,Iris数据集注明了每个鸢尾花卉样本属于什么品种。监督学习算法通过研究Iris数据集,学习如何根据测量结果将样本划分为三个不同品种。
半监督学习算法中,一部分样本有监督目标,另外一部分样本则没有。在多实例学习中,样本的整个集合被标记为含有或者不含有该类的样本,但是集合中单独的样本是没有标记的。
无监督学习和监督学习并不是严格定义的术语。它们之间界线通常是模糊的。很多机器学习技术可以用于这两个任务。
尽管无监督学习和监督学习并非完全没有交集的正式概念,它们确实有助于粗略分类我们研究机器学习算法时遇到的问题。传统地,人们将回归、分类或者结构化输出问题称为监督学习。支持其他任务的密度估计通常被称为无监督学习。
表示数据集的常用方法是设计矩阵(designmatrix)。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!更多内容请加danei456学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。