0-1搭建个性化推荐系统的设计思路

访客4年前黑客资讯1207

编辑导语:本性化推荐系统是互联网和电子商务成长的产品,它是成立在海量数据挖掘基本上的一种高级商务智能平台,向顾主提供本性化的信息处事和决定支持。本日,本文作者就团结本身的经验,为我们分享了从0到1搭建本性化推荐系统的设计思路。

0-1搭建本性化推荐系统的设计思路

1. 设计目标

商城已上线2周年,已有10万+在售物品。需要推荐系统,辅佐用户从过量的物品中,快速发明优质物品,缩短用户路径,提高订单量。

今朝商城订单量、用户数增长迟钝,所以需要推荐系统,作为新的增长点,发动业务增长。

通过全面收罗用户、物品数据,并阐明种种用户对种种物品的爱好,可以辅佐商家快速相识平台内用户爱好,相识本身的物品特点,提高订单量。

2. 产物布局

0-1搭建本性化推荐系统的设计思路

3. 推荐模子设计 3.1 基于物品的协同推荐

3.1.1 算法道理

0-1搭建本性化推荐系统的设计思路

基于物品的协同推荐算法认为:当用户A喜欢物品a,且物品a和物品b相似,则认为用户A喜欢物品b。所以搭建该算法分为两步:

计较用户A对物品a的喜爱度

计较物品a和物品b的相似度

用户A对物品b的爱好矩阵=用户A对物品a的爱好矩阵+物品a和物品b的相似度。

3.1.2 明晰用户的喜爱特征的权重

按照和业务专家的劈头接头,明晰用户对物品的喜爱度,与以下行为有关:

欣赏:用户进入物品详情页后,在详情页逗留的时长高出5S;

保藏:用户点击保藏按钮,保藏了物品,且未打消保藏;

下单:用户购置过该物品,且未退货;

转发:用户转发过该物品。

按照上述维度,可构建判定矩阵:

0-1搭建本性化推荐系统的设计思路

将上述矩阵举办归一化、计较权重后,最终计较的权重功效如下图所示:

0-1搭建本性化推荐系统的设计思路

欣赏:0.1,保藏:0.29;下单:0.43;转发:0.18。一致性检讨进程如下图所示:CR=0.02<0.1 一致性检讨通过

0-1搭建本性化推荐系统的设计思路

最终确定尺度化指标,如下表:

0-1搭建本性化推荐系统的设计思路

3.1.3 构建用户对物品的喜爱度矩阵

按照上述计较进程,可以计较用户对某物品的喜爱度。

譬喻用户1,对物品a:欣赏了13S,未保藏,下单了1次,转发了2次,则用户1对物品a的喜爱度为:2*0.1+0*0.29+1*0.43+2*0.18,最终计较所有用户对物品的喜爱度矩阵:

0-1搭建本性化推荐系统的设计思路

3.1.4 构建物品对物品的相似度矩阵S

凭据喜爱度矩阵R,按照皮尔逊相干系数公式(两个变量之间的皮尔逊相干系数界说为两个变量之间的协方差和尺度差的商),可计较出多个物品之间的相似度:

0-1搭建本性化推荐系统的设计思路

Xi:用户i对物品X的喜爱度

`X:所有用户对物品X的喜爱度的算数平均值

Yi:用户i对物品Y的喜爱度

`Y:所有用户对物品Y的喜爱度的算数平均值

r: 物品x和物品y的相似度

最终可计较出相似度矩阵S,矩阵为对称矩阵:

0-1搭建本性化推荐系统的设计思路

3.1.5 预测用户A对物品b的爱好

0-1搭建本性化推荐系统的设计思路

通过爱好矩阵R*相似度矩阵S,即用户i对所有物品的评分作为权重,和物品j中的物品相似度乘积加和,可获得用户i对物品j的评分预测P(i,j)。

3.2 基于用户的协同过滤

0-1搭建本性化推荐系统的设计思路

基于用户的协同推荐算法认为:当用户A喜欢物品a,且用户A和用户B相似,则认为用户B喜欢物品a。

所以搭建该算法分为两步:

计较用户A对物品a的喜爱度

计较用户A和用户B的相似度

用户B对物品a的爱好矩阵=用户A对物品a的爱好矩阵+用户A和用户B的相似度,计较进程和基于物品的协同过滤的极度进程根基一致。

4. 推荐结果验证

在推荐系统上线前的离线测试、 AB测试阶段,需要系统的验证推荐系统的结果。

推荐系统推荐给用户的对象有几多是用户真正喜欢的、带来了多大的转化率等等。验证推荐系统的结果常见的指标,包罗:

精确度

召回率

包围率

多样性

4.1 精确率

精确率暗示预测为正的样本中,真正的正样本的比例。

公式如下:

0-1搭建本性化推荐系统的设计思路

R(u)是按照用户在练习集上的行为给用户作出的推荐列表,而T(u)是用户在测试集上的行为列表。

相关文章

你有一份AMTT的面经,请查收

你有一份AMTT的面经,请查收

编辑导语:职局势试,是每小我私家在步入社会前都要经验的难关,也是获得一份事情的重要一关。那么在口试的进程中都有哪些需要留意的细节呢?我们又该如何去应对呢?本文作者为我们做出了具体地解答。 最近挺多公...

做公众号算就业,真的还有机会吗?

做公众号算就业,真的还有机会吗?

编辑导语:以前做公家号往往是基于宣传性质可能是小我私家喜好,而如今,公家号博主也属于就业了。微信公家号2012年上线,迅速引起了一讲明册公家号高潮。此刻在公家号这片饱和状态的红海,想进入尚有时机吗?本...

Axure中全局变量的应用技巧

Axure中全局变量的应用技巧

编辑导读:在实际应用中,全局变量起到了信息通报浸染和符号浸染,可以在多个页面间通报信息,可能作为非凡场景的判定依据。本文作者对Axure中全局变量的应用举办了先容,适合对Axure的页面、元件、交互事...

产品新人进阶之路(1):功能需求文档

产品新人进阶之路(1):功能需求文档

产品经理要发现需求,而不是复制已有的需求。功能需求文档能够帮助产品经理深入理解需求,理解“为什么要做、为什么这么做”。 本文乃作者应一位朋友要求,将项目分析的经验总结并撰写成文。 我所在的公司将产品...

垂直电商死灰复燃?

垂直电商死灰复燃?

编辑导语:垂直电商,是指在某个行业可能细分市场深化运营的电子商务模式,网站旗下商品是同一范例产物,大多为B2B可能B2C业务。其优势在于专注和专业,可以或许提供越发切合人群的特定范例产物,满意某个规模...

国内冷链溯源发展现状

国内冷链溯源发展现状

编辑导语:上篇文章中作者分享了《什么是冷链溯源?》,相识冷链溯源后,我们知道了部门食品会颠末冷库的生存和运输,半途也会颠末多次中转,可是此刻还未实现全程冷链物流;本文作者阐明白海内冷链溯源的成长近况,...