我?不知道如果你有这样的生活经历:我在寻找“什么口红女孩子都喜欢”我的手机早上中午我看见把口红的广告;我刚刚和我的朋友的电话告诉中午我看见把口红的广告;我刚刚和我的朋友的电话说什么背包旅游的原因当我打开购物网站我看见旅行袋的建议。
在这个时候有一个疑问为什么手机知道我们想要什么?
首先你必须知道你社交网站购物网站包括您所使用的苹果和Android手机没有许可窃听你的手机或窃取你的搜索信息但你的行为数据时使你的手机知道你想要什么。
一个例子?当你注册一个账户你需要输入你的名字;手机号码;性别;位置;这些都是简单的基本数据。
当然还有你的消费记录;计程车之旅的频率;您浏览的官方账户类型;奥运会你了……这些行为最终将成为成千上万的fact-labeled手机并成为你的行为数据。它的一部分。
收集标签的目的是建立用户画像。知道从凌乱的标签你最终将模拟一个“你”是谁类似于你的兴趣爱好和想法。
举个例子你想看一篇文章的内容标签“美”当你玩你的手机这并不意味着你真的喜欢美女吗?它可能是滑。因此你的手机法官你的兴趣和偏好的基础上的停留时间浏览搜索的数量是否要转发评论等等。
当然手机这是相关的主要内容标记加权算法:
兴趣标签(美)重量=行为重量x访问时间衰减因子
行为重量:1点为何评论+ 0.5+ 0.5你转发+ 2+ 1
集合时间重量:什么是重量在10年代重量在10年代是1吗?10 s-60s衰减因子比60年代:2
0 - 3天的重量是1的3 - 7天的重量是0.85手机7 - 15天的重量是0.7为什么15 - 30天的重量是0.5和30天的重量是0.1
(从百度将学习算法引用)
兴趣标签重量密切相关你的阅读时间评论、转发和收藏喜欢和不同的业务有不同的加分最终积累成行为权重。
这有点类似于歌曲推荐网易云在私人调频。呆的时间越长时间越高体重。
你经常浏览美丽的女人吗?对漂亮的女人评论文章对漂亮的女人在你的手机观看视频。手机会积累你的兴趣权重对漂亮的女人在一段时间内。为什么然后使用乙状结肠函数标准化知道最后一个兴趣标签值从0到10。
值越高你越感兴趣的内容包含漂亮的女人。
不仅限于内容和利益该算法还可以创建用户画像根据你的消费能力消费利益社会习惯和其他维度计算你的偏好。
?这些首选项将被转化为特征向量。例如你的美丽的兴趣标签值是8手机为什么你的消费能力5、社会偏好是2那么向量表示为r (8 5 2)。
我们可以想象特征向量作为一个多维空间坐标点。每个用户可以使用向量的坐标将余弦公式或你想要的距离公式如何那么向量表示为r (8 5 2)。
我们可以想象特征向量作为一个多维空间坐标点。每个用户可以使用向量的坐标将余弦公式或你想要的距离公式可以计算它类似于你的人做什么为什么你的手机知道你想要什么?然后分类用户。这是一个大项目。