课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
时效性是我们在做数据分析的时候需要重点关注的一个问题,而今天我们就通过案例分析来了解一下,数据分析时效性都有哪些思维误区。
普遍的思维误区主要有两点:
我们潜意识中认为,数据时效性越高,价值自然越高,从而忽视了业务规律,进而导致我们没有聚焦到与实时计算更契合更有价值的业务上。
我们潜意识中认为,实时计算的推进的关键和瓶颈在于技术上。只要技术进步,业务自然会出现,使得我们习惯被动等待需求,加上实时计算的特性,让我们更容易与业务脱钩。
更进一步分析,这些思维误区,和目前数据业务的分工模式也有着较大的关联。
当前,数据业务通常会分工为研发和工程两种。简单来说,就是数据科学家和数据工程师两种角色。笔者所在的公司和团队即是如此。
早期,这两种角色通常是一个人兼职的。后来,因为技术门槛和开发耗时等原因,部分人员就分化出来专职从事数据工程师这一角色,专门负责数据开发、业务实现和进一步的平台化等工作,这样效率更高,更有规模效应。
实时计算自然更多是数据工程师的范畴。然而,在业务方面,这种分工模式会带来一些深层次的问题。
如前文所言,因为实时计算的高时效性,其在数据业务创新和开发流程中,参与程度会更加小。按照当前数据业务分工模式,数据工程师只专注于业务实现上的话,业务空间自然会压缩得更小。
基于技术进步和数据工程师二次开发的框架,实时计算业务开发的成本和门槛已经大大降低。将来,数据科学家有更好的条件进行业务实现,这也会进一步压缩数据工程师的业务空间。
实时计算的高时效性特性,其业务的个性化特性会更加明显。在当前分工模式下,实时计算的落地和推广实际上依赖和受制于数据科学家的需求,这会带来一些负面影响:
需要高时效数据的业务的个性化明显,数据科学家在探索、调研和实验阶段可能难以利用现有平台,而是手动实现数据流程,导致路径依赖,对实时计算方案感知度低;
数据工程师主要把数据科学家作为业务推进的目标受众,因为数据科学家对实时计算的感知度低,不能给数据工程师提供有效的反馈,导致实时计算业务的推广和落地受阻;
这些因素相互影响和交织,形成实时计算业务推广的瓶颈和阻碍,这是目前实时计算面临的困境。
在实时计算这一领域,专注业务实现、被动等待需求,给业务创新和推广带来的瓶颈和阻碍会越来越明显,不能长久。现在已经不是能不能实现的问题,我们要更多地考虑实现什么的问题。
【免责声明】:本内容转载于网络,转载目的在于传递信息。文章内容为作者个人意见,本平台对文中陈述、观点保持中立,不对所包含内容的准确性、可靠性与完整性提供形式地保证。请读者仅作参考。更多内容请在707945861群中学习了解。