课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
搜索可以说对于用户来说是一个非常好的使用体验的功能设计,而我们能够提供的搜索算法数据越多,得到的结果也越准确。今天我们就一起来了解一下,关于搜索算法的几种实现方式。
1.理解数据,并使用分层抽样
数据是确定整个过程策略的核心。图像质量可能会引入复杂性,需要谨慎处理。了解目录中的图像以及用户在视觉搜索期间上传的图像非常重要
2.数据增强是关键,特别是图像旋转。
当训练数据不能包含真实场景中可能发生的所有变化时,数据扩充是训练神经网络的关键步骤。当用户使用手机拍摄对象时,很可能图像出现被裁剪、旋转、变得模糊或者没有被缩放到合适的尺寸等情况。
3.提取语义签名时尽可能多地使用监督信息
正如上文中提到的,尽可能多地使用监督信息是非常重要的。这有助于训练分类器关注信息性内容而忽略其他非信息性区域。
4.签名的熵分析
这一步通常会被大型信息检索系统的系统设计所忽略。评估给定的签名容量内是否包括了足够的有效信息是至关重要的。
5.当标签为粗粒度标签时,类内方差是很重要的。
我们使用粗粒度叶子类别标签代替产品ID来训练神经网络。部分原因是由于叶子类别虽然是粗粒度的,但是更容易获得。
6.用排除法提高搜索速度和精度
专为高速度和高精度而设计的排除法具有强大的能力。例如,如果输入图像包含运动鞋,那么没有必要搜索裙子、桌子、计算机的库存清单。
7.绝对vs.累积top-k划分
我们使用强分类器,一个使用强叶子类别标签训练的深度神经网络,来预测选叶子类别(通道)。当选预测的置信度较高时,则不需要搜索其他分区。
【免责声明】:本内容转载于网络,转载目的在于传递信息。文章内容为作者个人意见,本平台对文中陈述、观点保持中立,不对所包含内容的准确性、可靠性与完整性提供形式地保证。请读者仅作参考。