
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
我们在进行数据分析的时候,首先要求的就是数据一定要达到一定的量级并且是多样化的数据,只有这样才能保障我们数据分析结果的准确性。所以,今天我们就一起来了解一下计算机是如何来获取这些数据的。
计算机视觉的任务就是要对几种和视觉相关的媒体做一些信息处理,包括图片、视频以及深度视频。
通过这些媒体我们得到的对象包括人脸、人体、车以及其他,这里其他对象的范围比较广泛,比如说宠物、食品、普通物体分类等等,但是它的应用范围应该远不如前三者。
得到了这些对象的图像信息之后,我们要做什么任务呢?总结一下,比较广泛应用的有两种任务,一是结构化,二是图搜。
结构化是指这个对象确切可描述的信息。比如一张人脸图片的结构化信息包括人的性别、年龄、表情类别,以及戴不戴眼镜、口罩、帽子等信息;人体的结构化包括人的上身下身的衣着特点等;车辆的结构化信息就比较多了,基本的有车牌、车型、年款、颜色等,另外有一些可以描述的特征信息,比如车窗内挂件、摆件,甚至是否有划痕等等,这些特征描述对于区分一些很像的车是非常有用的。
然后是图搜,图搜的信息基础是没有结构化描述的,计算得到的是一个特征。我们常谈到的人脸识别就是典型的图搜应用,最典型的1:N人脸搜索就是以一张脸搜图库里的脸,得到和它距离很近的一些脸。人体和车也是一样,只不过人体和车辆的特征维度相对于人脸来讲少一些,这决定了人脸搜索可以在一个更大的库中发生,人体和车辆只能在相对小的库中搜索。
对于结构化和图搜这两种任务来讲,图搜具有更广泛的应用场景,为什么呢?得到结构化信息之后,通常是作为数据库索引进行搜索,但是具体应用中很难单纯依赖结构化信息得到想找的对象。比如要找一个人,很难通过具体描述这个人是长头发、有胡须、戴眼镜或者其他可描述的细节直接找到这个人,但是如果提供一张这个人的照片,就可以在人脸库里很好地搜索到。车也是一样,我们通常通过车牌来搜索一个车,但是在真正的应用场景里,这是不一定生效的。比如一些犯罪分子在办案时往往会把车牌隐藏掉,或者干脆用一个假车牌,这时候就需要用车的特征来搜索,这样的场景下技术带来了真正可用的价值。
首先是云服务的应用,这在公安这类机密客户那里是远远落后于商业及个人用户的。我们去年经常做这样的事情,就是把一堆服务器搬到用户的机房里,比如警方或者交管局,我们留下专人运维这个机房里的服务器,我们连接客户的视频流,利用CPU和GPU去计算前面所所说的东西,然后把结果在它的客户端体现出来,或者是推送到客户的平台中。
但从今年开始我们有一些新的东西受到了老客户的青睐,对于类似于公安或交通这样的传统用户,他们竟然也或多或少的接受云端的方案,这在以往是不可想象的,因为他们的技术和数据是非常机密的。但是现在一些云服务提供商针对公安、银行这些具体的业务做了大量专用网络和安全上的优化工作,使得这个事可以发生。
另一方面就是越来越多地使用了EDGE端的计算,端到端(EDGE端到CLOUD端)已经不再是什么秘密,一个很直接的结果就是降低了成本、提高了密度、以及广泛的智能化。举个例子,原来的IPC(网络摄像机)都是传视频到后端去处理,现在很多专门的车辆及人脸抓拍摄像机可以在终端设备上把我们关注的对象抓拍成图片,再把图片传到后端去处理,一方面是节省带宽,原来一个Gb的带宽只能传输几十路视频,现在只传输抓拍图片可以做到万路,更令人激动的是,假如抓拍设备部署在普通的超市、饭店这样的街头小店里,使用非常便宜和普通的家用带宽就可以满足要求。另外一个好处是后端服务器的计算成本极大降低,可能降低两个数量级这样的程度。两个数量级大家可以想象是什么样的情况,我们可以把一个应用做到非常便宜,可以从原来2G的业务逐渐做到2B的业务,再逐渐做到2C的业务。目前零售行业以及一些智能办公行业已经在尝试这样的业务方式,总结一下,就是我经常在公司和客户那里说的三个词:低成本、高密度、智能化。这是从业务上来分析计算机视觉的一些情况。
这里边有几个事情我需要说明一下。第一个是深度视频,深度视频相关的产品我们在四年前就开始做,我不否认它的科技范儿,以及在一些场景里它不可替代的作用,但是到现在为止还是一个成本比较高的产品,所以它大都应用在类似于银行加钞、金库、监狱等支付能力非常强的客户。深度视频的作用显而易见,通过深度数据,它很容易能够计算出人的肢体行为、行动、人和环境关系等信息,而普通二维数据很难做到。这个产品目前还不具备广泛场景的扩展性,但是随着传感器技术的提高,事实上我们已经看到一些这方面的成果,它也会满足前边提到的低成本、高密度、智能化的原则。
另一个要说明的是视频,这就是刚才讲的,逐渐会把后端视频的处理转移为前端抓拍之后在后端对图片的处理,这样降低了两个数量级的成本之后,最大范围地进行业务的推广。大家可能很奇怪,之前GPU的势头很猛,NVidia的股价在一年时间里飙升了三倍不止。但是我想说的是NVidia工业级别的显卡价格和CPU这样的市场相比是小众和暴利的。CPU是个2C的市场,GPU也有2C的市场,但是工业级别的GPU显卡,它的市场价格是普通显卡的几倍。之所以能维持高价,是因为之前少有替代品,然而我们今天看来它的优势越来越小。
一方面,现在有很多算法上的进展告诉我们,同样的算法在CPU上也可以高度的优化,它的成本和在GPU上可以媲美。而结合CPU服务器的稳定性和灵活性,比如分钟级别的弹性调度,它的实际成本还有一个数量级的优化空间。
另一方面,它的竞争对手还包括ARM、FPGA、Google的TPU芯片等这些日益成熟的专有计算芯片。这样的结果告诉我们,我们以前好像做错了,我们建立了大量的GPU集群,某个友商甚至利用它上一轮融资的千万美金建立了一个几千块GPU的私有计算集群。但是大家往后看,这可能不是特别值得,我感觉一两年内就会发生的是,首先GPU的价格会降低到非常亲民,专有计算芯片无论在服务器端还是在轻量级设备端都普及。
人眼相机是可以应用于大广场、大范围的人脸抓拍机。另外还有抓拍服务器,对接普通的IPC,通过这个抓拍服务器可以把普通的IPC变成抓拍机一样的形态来对接系统。中间系统上下两个蓝色的数据流,下面的数据流是实时业务流,上面是像黑白名单入库之类的离线业务流。视频数据由抓拍设备转换成图片之后会经过人脸引擎进行处理,这个大规模的引擎包括人脸检测、特征提取和结构化,对于车的数据也类似地会有相应的车辆检测和结构化,然后经过存储、比对引擎和消息队列,形成我们的一套系统,后面对接应用的API池。上面还有一个从数据库对接出的离线数据分析和实时数据分析系统,它结合其他平台的业务数据,对结构化数据和比对结果进行大数据分析,并汇集到一个多维查询系统。
每个行业都有它自己不好做的地方,AI这个细分行业里最大的特点就是数据依赖。大家可能都知道AI算法基本上都是以基于学习的算法为主,简单的讲就是通过大量的数据标注之后(Data),对一个网络(Network)的参数进行迭代优化得到一个模型(Model),业务层通过这个Model进行推理计算。我这个题目叫“如何开始一个AI业务”,当你在自己的业务上考虑这个问题的时候,你要用AI解决什么问题,首先要问自己数据够不够,第一是量够不够,第二是质量够不够,第三是数据的多样性够不够。
作者:苑维然
来源:infoq
【免责声明】:本内容转载于网络,转载目的在于传递最新信息。文章内容为作者个人意见,本平台对文中陈述、观点保持中立,不对所包含内容的准确性、可靠性与完整性提供形式地保证。请读者仅作参考。