
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
我们在上文中说过,在学习山西达内SEO培训课程中关于网站日常维护的文章内容来源的问题。除了我们原创的以外,最多的内容都是从互联网上获取的伪原创内容了。但是,互联网上的信息又那么多,我们又应该如何选择我们需要的内容呢?
关于太原达内网络营销培训课程的具体课程体系和知识点这里就不细说了,感兴趣的朋友可以与我们的咨询老师联系,下面,我们主要是介绍一下关于我们在获取到内容之后,应该如何调整和筛选发布的问题。
我们已经“警告”过,构建大池,势必会引入一些杂质。杂质是没有资格在一个应用内流转的。我们所说的杂质包含:
背离产品价值观的,如低俗擦边球,色情的;
干扰用户正常消费的,如骗点击内容,垃圾内容;
威胁平台存活的,如政治类内容。
构建粗筛池,就是从大池中将这些没有资格的内容分拣出来扔掉,同时进行初步的质量评价。
识别这些杂质,一般是机器+人工的模式。我们可以根据内容本身、内容提供商、抓取源等维度进一步对内容池去噪。
对内容质量打分,主要就是构建一个打分模型,利用相关特征拟合一个分数。对于一个视频网站,可以用到的特征有:内容的发布时间、视频长度、视频热度、非广告/政治敏感/色情/黑名单、标题质量,以及视频的历史表现,如点击率、点击量、停留时长等。
对内容提供者打分方法类似,主要区别在于特征,对于视频应用来说,可能有:上传者历史视频的播放量、点击率、播放完成率、赞/踩等;上传者的等级、活跃度、社会影响力等。
最终,根据内容质量分数和内容上传者分数,就建立了一个内容池优选模型,对已有的视频做一个排序,其中低质和劣质的内容可以直接过滤掉。
细筛池是在粗筛池之上,结合具体的推荐场景和业务目标,进行一些人为干预:人工调权、调整多样性等。
先说人工调权,需要首先增加一个字段,专门用于设置人工权重。大家不要觉得一提到人工调权就有点“拿不出手”,其实人工权重是必不可少的,某些信息无法通过自有产品数据及时反馈到当前内容上来,如上传者是微博上的KOL,或是视频网站的PGC,这些站外信息虽然人知道,但是没有数据就无法让机器知道,这样就可以通过人工对其调权,以此将其反应到自己的内容池中。
再说多样性。内容池在各个主体上分布一定是不均衡的,某些热门的主题会内容较多,而某些冷门的主题会内容较少。这也需要人工干预多样性,适当帮助补充一些冷门主题的内容池。
内容池构建机制到目前,已经可以上线使用了。但是这其中无论是大池、粗筛池、细筛池,所依赖的模型还是离线构建的,调整起来有一定的延迟,在实时场景下我们应该考虑更及时的动态筛选。
因为我们要关心很多诸如这样的问题:当内容池上线被用户看到后,到底效果如何?低效的如何实时被淘汰?为了解决这些问题,所以最后设置了精筛池这个环节。
达内时代科技集团致力于培养面向电信和金融领域Java、C++、C#/.Net、3G/Android、3G/IOS、PHP、嵌入式、软件测试、UID、网络营销、网络工程、会计、UED、web、Unity3D、大数据、童程童美等17大方向中高端软件人才课程与少儿教育课程。选择太原网络营销培训,不再孤军奋战,轻轻松松做IT高薪白领。太原达内培训带领有明确目标的学子迈向成功之路!想找工作的求职者可以加QQ:3373924515(太原达内就业服务部)咨询了解。