有两个网站上的推荐系统的基石他们是用户标记和实质性的理解。在真正的理解有封闭学习的某些方面。与这两个相比网站优化有封闭学习的某些方面。与这两个相比别名用户标记的方法更加困难。
在今天?网站标题我们经常使用的用户标签是重要的用户想了解也许非常重要closed-head词汇等等。关于用户的性别信息我们不妨赢得来自第三方社会账户。用户的年龄信息主要是猜到了从模型中主要根据用户的浏览时间和模型。如果当地负责人经常检查获得的用户是谁?年代的授权网站检查
自然最可能的最先决条件后用户标签在网站上是实际的标签用户赞赏。的重要性分为三个方面:第一个方面是过滤音乐网站用户后将过滤标题党?保持时间。第二个方面是受欢迎的治疗。对一些文章很受用户欢迎的网站用户可以在上面留言但也有一些不好的评论这将是处理。例如断电处理等等。第三个方面是时间衰减。随着年龄降低用户的幽默会爆炸所以网站的策略更倾向于新用户。让我们跟随用户的方法来减少时间一些权重将减少如果他们努力工作。第四个方面是处理和显示。如果有一篇文章推荐给用户但不点击然后将处理相关的权威。
方法发现用户标签通常是一些近似closed-head词汇。例如第一个版本的用户标记的最后期限标题是批量评估框架。在这个类别这个过程是比其他人更复杂。可能。
然而问题是在用户的迅速减少各种幽默模型和其他批处理责任减少和预计金额太大的影响。2014年Hadoop负责批处理数以百万计的用户的标签创新在同一天完成不满又开始了。集群有效估计很容易做其他事情时资源紧张。写为单独的存储系统的压力也在不断增加和用户的兴趣标签的速度创新正变得越来越高。
面对这些挑战。在2014年底Toutiao推出用户标签风暴集群流估算系统。改变流后只要有一种方法为用户创新标签将会创新。CPU的价格是相对较小的这样你就可以节省80%的CPU时间大大降低了估计材料支出。同时只有几十个机器需要支持成千上万用户的幽默的模式创新每一天和功能创新的速度非常快和基础可以按时完成。该系统已应用于今天推出以来。
很自然地我们还创建一个流媒体系统用户不需要十英尺厚的标签。信息如用户?年代的性别、年龄、和居民位置不需要反复估计时间维持日常创新。
第四评估和理解
介绍了推荐系统的完整结构那么如何评估建议的有效性呢?推荐系统也很常见。
事实上很多因素是推荐给城市效率。例如候选人关注改革减少召回的校正模块推荐的功能降低修正模型的结构存在算法的优化参数等等不给一个接一个的例子。评价的基本原理是许多优化可能是负面结果最后不会纠正结果优化后就已经上线了。
一个深思熟虑的评价和推荐系统需要一个坚实的评价体系丰富的测试平台一个易于使用的经验。所谓的固体测量系统并不是一个简单的目标。不可能只看停留的速度和时间等等这就需要一个全面的评估。在过去的几年里我们一直在尝试我们是否可以合成尽可能多的目标为一个独特的评价目标但我们仍在探索。目前我们推出后仍将决定全面计划的评审委员会相对每个事务的高级co-learning组成。
许多公司的算法表现不佳。