
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
相信大家在使用一些电商购物平台的时候应该发现了,大部分的搜索框除了能够进行产品的关键词搜索以外,还可以通过拍照技术上传图片进行匹配搜索。今天,我们就一起来聊聊关于互联网图片识别技术都有哪些变化的。
Google和CMU的研究员使用3亿张图片,在图像识别算法的几个指标上取得了长足改进,而往常的训练一般只使用一百万张图片。
很多开发者在训练物体检测算法时会使用包含一百万张图片的ImageNet数据集。这个数据集从2011年起就没有新图片加入了。然而,在该数据集上训练的神经网络中的参数数量与日俱增,训练模型的GPU算力也在增加。卡内基梅隆大学(CMU)中Google的研究人员和科学家提出:如果增加训练数据量会如何?
于是,Google建立了一个内部数据集,含有3亿张图片,标记为18291个类别。图片标注的来源包括原始网络信号,网页之间的联系,以及用户的反馈。因为不是由人标注的,所以含有20%的噪音。
结论是:增大数据量果然有益。虽然图片标记含有噪音,算法的准确率还是提高了3个百分点。很明显,数据量的增加克服了标记的噪音。研究人员发现算法的表现和数据量呈对数关系上升,如图所示。论文作者认为,现有的模型是基于一百万张图片建立的:如果对模型进行调整,准确率还有上升空间。
研究人员在微软的COCO对象检测基准测试上进行了测试,结果喜人:平均正确率(AP)从34.3上升到37.4。Google和CMU在ICCV会议上发布了算法和评测,并发布了论文《重新审视深度学习时代数据的非理性效果》,可在arxiv自由获取。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!