图解推荐系统

访客4年前黑客工具829

编辑导语:推荐系统(recommender systems),是操作信息过滤技能向用户推荐其大概感乐趣的信息,它是有别于信息分类和信息搜索的信息处理惩罚 *** 。我们用言语来表明推荐系统,好像老是感受艰涩难解,本文作者为我们图解了推荐系统。

图解推荐系统

回首20多年前推荐算法提出的90年月,也是中国互联网起步的时候,欣赏派别网站即可满意我们对数字世界摸索的大部门需求,彼时是‘人找物’,系统推荐的应用空间不大。

时间在推移,内容亦在富厚,在当前海量信息爆炸的时代,八门五花的内容琳琅满目,让人应接不暇。此时需要‘物能找人’,因此推荐系统将符合的内容推送给符合的用户实在是恰逢其会。

一、系统初探

那么推荐系统是如何运转的呢?为什么它知道我在某宝上要买的是咖啡而不是啤酒,然后在App的首页泛起?

答复这个问题,我们先从推荐系统流程的角度着手相识:系统将一个物品/内容推荐给用户主要经验两个步调,即召回与排序。

图解推荐系统

当人们欣赏一个电商网站,好比女生会存眷种草喜欢的美妆博主、保藏某一品牌的护肤品、加购了三只松鼠的坚果比及双十一叫男票清空购物车……这一系列的行为回响了你对某些商品的偏好,致使系统能大抵勾勒出你的乐趣。

在购物网站上会有许多与你乐趣相似的用户,你们有着雷同的爱好,Ta喜欢的对象或许率你也会以为不错,通过行为统计寻找你们的相似度就可以找到那些同类用户喜欢的而你还没有打仗过的商品。

别的,商品之间也有相似的属性,好比《妖怪经济学》与《牛奶可乐经济学》是有关行为经济学的著作,一般我们就接见到电子书网站会为看过《妖怪经济学》的读者推荐《牛奶可乐经济学》。

如上描写的把相似的用户与相似的物品匹配起来,从而筛选出用户感乐趣物品的进程就是召回。

召回阶段取回的物品数量凡是都较量大,大概在十万百万量级以上,进一步地,推荐引擎团结多种因素考量(好比业务特征、人工过问等),风雅筛选出Top100款甚至更少的物品推荐给用户,这就是排序的进程。

从系统流程可以看出,相似度是推荐系统的焦点环节。那么用户之间、物品之间的相似度怎么界说、如何计较呢?

二、找到相似的用户/物品 1. 相似度计较

对付推荐系统来说,凡是是基于向量来确定两两用户或两个物品是否相似,即系统首先要把用户(用户属性或用户行为偏好)、物品(物品特征)向量化。

好比有5件商品:夹克、连衣裙、球鞋、网球拍、贝雷帽,1暗示用户购置过该商品,0暗示未购置过。用户P买过夹克、球鞋、网球拍,用户Q买过连衣裙、网球拍、贝雷帽,则用向量暗示用户P和用户Q就是R(P)=(1,0,1,1,0),R(Q)=(0,1,0,1,1)。

图解推荐系统

那么如何计较两个用户是否相似呢?

计较相似度的公式有许多,如‘欧几里德间隔’、‘皮尔逊相干系数’、‘余弦相似度’等。余弦相似度是常用的计较要领,即当两个向量之间的夹角越小,则两个向量越相似。

让我们回想一下中学关于两个向量u、v的余弦相似度公式:

图解推荐系统

操作公式,可以知道用户P(1,0,1,1,0)和用户Q(0,1,0,1,1)之间的相似度为:

图解推荐系统

2. 最近的邻人

所谓物以类聚、人以群分,系统虽然不需要按相似度遍历所有数据,一般推荐引擎只需要寻找一批与方针(用户/物品)最相似的‘邻人’构成一类群体进而做物品推荐。

接下来看看最近的邻人是如何确定的:以用户间的相似度举例,想象一个二维平面,每个用户代表一个点,用户(点与点)之间的间隔就是相似度的巨细;计较用户①的若干个最近邻,一种方案就是以方针用户①为圆心,设定一个间隔K,落在半径K的圆中的所有用户就是①最近的‘邻人’。

图解推荐系统

三、推荐算法范例

相关文章

用户画像ID体系建设:以阿里、网易、美团、58为例

用户画像ID体系建设:以阿里、网易、美团、58为例

编辑导语:在上篇文章《一文从0到1把握用户画像常识体系》中,本文作者为我们阐明白用户画像常识体系。在上篇文章的基本上,本日,作者又以阿里、网易、美团、58为例,阐明总结了用户画像ID体系建树,帮你理清...

完美日记的私域运营经验不值得学习?

完美日记的私域运营经验不值得学习?

最近和电商商家相同“为什么存眷私域”的时候,发明不少商家其实都较量被动盲目。 本身也没想好为什么做私域,如何做私域。凡是只是看到整个行业都在炒这个观念,身边的同行都在存眷这块儿,似乎本身不存眷就会错...

一个普通产品经理在魔幻2020的求职经过

一个普通产品经理在魔幻2020的求职经过

编辑导读:这个魔幻的2020年,令原本就艰巨的求职“落井下石”。作为一名产物司理,想要在本年得到一份事情需要筹备什么,面临什么?本文作者以本身的亲身经验,分享在本年求职的进程,但愿对你有辅佐。 本人...

用户调研时,可以用这12种方法优化你的提问

用户调研时,可以用这12种方法优化你的提问

在实际事情中,我们需要常常吸收用户的反馈。可是过于直白的询问大概会令用户感想不适,那么采访时有没有什么能力呢?本文罗列了六种采访时常见的错误而且给出了发起,但愿对你有辅佐。 正确的问题不可是简朴地脱...

把事情看明白讲清楚:视觉化思维

把事情看明白讲清楚:视觉化思维

视觉化思维是职场上必不行少的重要思维方法,可以辅佐我们让事情更高效,也能熬炼其他的进修、阐明等本领。本文作者团结自身履历,从视觉化思维是什么、有什么利益、怎么造就和实际应用这几个方面临视觉化思维展开了...

数字金融体验(1): 深度剖析主流金融App的服务定位

数字金融体验(1): 深度剖析主流金融App的服务定位

文章带各人宏观相识种种型金融App说明、根基业务和产物定位,但愿通过此文可以或许加深各人对数字金融的认识。 媒介 课题的配景 2020年春节,在疫情攻击下,数字经济表示出发达生命力,数字经济2.0时...