课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
随着互联网的不断发展,越来越多的用户都习惯网购,而今天我们就通过案例分析来了解一下,电商搜索功能设计需要注意哪些问题。
1、数据清洗(cleandata)
什么是数据清洗?它是发现并纠正数据文件中可识别的错误的后一道程序,包括检查数据一致性,处理无效值和缺失值等。
对于客户数据,这通常意味着大量的验证:
#、有效的URLS
#、数据类型约束(eg:库存必须是int)
#、范围约束(eg:库存必须是正整数)
#、值匹配,通过表达式或自定义程序代码实现
取决于数据供应商的职业,一些供应商公司还在通过Excel来管理他们的数据(eg:手动在Excel中更新库存数据)。一些供应商有一个成熟的软件系统管理他们的数据并允许你导出此类数据。
这给我们带来了另一个有趣的话题。你接受什么样的数据格式?JSON、XML、EDIFAC或者CSV?你有API或表单上传吗?你该如何处理多年没有更新的数据?
数据清洗是一件很棘手的事情,你需要一个万无一失的处理过程。如果你的数据清洗过程将商家产品价格更改为原始价格十分之一,并且有人下了1000个订单,这种情况怎么办?责任也是很重要的话题。
2、计量单位(UOM)
计量单位(UnitofMeasure/Measurement,UOM)。这不仅仅是关于系统指标,而且是关于到不同单位之间的转换。需要对所有数据的值进行规范化,这意味着,如果一个产品的尺寸是英寸,而另一产品的尺寸是厘米,那么就需要一个转换机制来进行适当的范围查询。你还需要确保对不同的产品使用了正确的计量单位,eg:显示器、饮料、视频包装等等。
3、重复数据
如果你经营一个商城,你会发现这些商家销售相同商品的几率很高。
如何处理这种情况?这个问题在图书品类中已经通过ISBN解决了。如果你是世界上大的商城,你就有能力创建一个ASIN。
也有一些可以考虑的替代方案。你可以为提供的照片检查相似性。复杂的检查方案会浪费很多时间,有时只需简单的考虑检测相同哈希值就足够了。
你也可以比较产品的描述,因为它们通常直接从生产商处复制。另外还有:产品名称、发布日期或计量单位等。
这些替代方案都不是百分百安全的。
4、库存数据
拥有近实时的信息是非常重要的。比如产品是可用的;比如产品不能在2-3天内送达,大多客户不会下单,因为客户往往是冲动性消费。
所以,要么你能查询其他系统(eg:查询商家系统获取新的数据),要么你的商家提供库存数据。库存数据更新通常比价格或产品内容更新更频繁,因此请确保使用一种轻量级的更新方式。
你可能还需要处理库存信息陈旧的问题,即在你平台上标识可用的商品但在商家处已经不再可用,从而导致订单取消和变更。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!更多内容请在707945861群中学习了解。