课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
随着我们对人工智能和机器学习技术的掌握程度的提高,企业在机器学习平台的搭建上也都有了自己的特点,下面我们就根据环境的不同来了解一下这些特点内容都有哪些。
准备数据是一次机器学习任务的起点,但数据准备的平台化,从实现上来说应该是比较困难的。因为数据准备是一个需求差异非常大、很难将其标准化的过程。目前开源领域也有一些针对不同场景的打标工具,如labelme等,但这一方面的工程实现和研究性工作其实都不太常见。
训练是机器学习任务中的重中之重。机器学习平台的训练支持指的是,用户通过指定使用的资源数量、分布式模型(AllReduce、ParameterServer等)、分布式配置(ParameterServer数量等)等,直接在平台上进行模型训练。
从平台的角度来看,这一特性主要涉及到对不同类型的框架、不同的分布式模型、不同的硬件的支持,以及分布式训练任务的服务发现、错误处理,不同任务的资源隔离与复用等问题。除此之外,有些场景对于在线训练也有需要,如何支持在线训练,是一个机器学习全流程都需要考虑的问题。
再接下来,就是模型服务。这一特性与传统的PaaS比较类似,因为模型服务目前多是以RESTfulAPI暴露给外部的,与传统的Web服务非常类似。不过从实现角度而言,不同的框架训练的模型往往需要用不同的方式发布出去,而且模型服务关注的度量指标与传统Web服务也有较大差别。
回到版本管理,传统的应用往往只涉及配置与代码的管理,而机器学习则多了不少新的维度,如模型、版本等。这一部分的特性虽然比较dirtywork,但是却与用户的使用体验息息相关。除此之外,还有整个过程中的监控问题(训练过程监控,服务过程监控),也是同样性质的工作。
在解决完上面的问题后,机器学习工作流的构建这一特性就水到渠成地摆到台面上了。如何让用户用尽可能少的交互取得他/她想要的效果,以及如何加强这一过程的自动化,是离不开工作流方面的工作的。
至于超参数训练与模型结构搜索,这是机器学习平台的高级特性。虽然自动机器学习听上去非常有前途,但相关技术目前仍处于研究阶段。对于超参数训练来说,难过的一关是性价比问题。RandomSearch、GridSearch和贝叶斯优化方法是常用的调参方法,它们找到的参数确实可能比人工调参有更好的效果,但与此同时,它们也会需要更多的硬件资源。因此这一特性属于锦上添花,而不能起到雪中送炭的作用。至于模型结构搜索,就更遥远了。
【免责声明】:本内容转载于网络,转载目的在于传递信息。文章内容为作者个人意见,本平台对文中陈述、观点保持中立,不对所包含内容的准确性、可靠性与完整性提供形式地保证。请读者仅作参考。