如何衡量推荐系统的好坏?

访客3年前黑客文章700

编辑导语:如今推荐系统无处不在,你收到的推送、看到的推荐等等都是通过推荐系统举办推送;一个好的推荐系统可以让三方共赢,那如何来权衡推荐系统的优劣?本文作者从“做的好欠好”和“还能许多几何久”两方面举办阐明,我们一起来看一下。

如何权衡推荐系统的优劣?

上篇文章从非技能的角度写了一些推荐系统相关的理论常识,没看过的可以先去回首下前情概要《一文带你把握推荐系统》。

上篇文章有部门内容是关于推荐系统数据指标的,其时主要是从《推荐系统实践》那本书里直接搬运过来的,没有具体展开,所以就再补一篇如何权衡推荐系统优劣的文章。

之前我们提到推荐系统存在有一个很是重要的前提,那就是信息过载——我们想做的工作是在满意用户本性化需求的基本上,充实挖掘长尾资源,晋升整体资源操作效率。

假如把整体资源看作待开采的宝藏,那推荐系统就可以看作是矿机,要做的工作就是不绝的挖掘宝藏,发挥宝藏应有的代价。

从这个角度来看,权衡推荐系统做的好欠好可以从两方面来评估:

一方面是推荐系统自己做的好欠好,开采效率高不高;

另一方面就是推荐系统还能许多几何久,究竟宝藏的开采也是需要恒久可一连成长的。

下面我们别离从做的好欠好与还能许多几何久这两个角度来看下如何权衡推荐系统的优劣。

一、做的好欠好

可以从深度和广度这两个维度来举办评估。

先来看深度,主要是权衡推荐系统的功效,凡是会有评分精确度、分类精确率、排序指标和贸易指标等。

1. 评分精确度

在接头这个指标之前,先来说下另一个问题。

推荐系统的预测一般分为两种,一种是评分预测,一种是行为预测。

评分预测是按照用户以往对物品的打分环境,预测用户对新物品的打分;好比用户A之前看过3部影戏,这时候想给用户推荐别的一部影戏,评分预测就是预测用户A对这部影戏大概的打分。

行为预测指的是直接预测行为自己产生的概率,好比用户有多大大概性发生点击、购置可能点赞、分享操纵。

评分精确度是为了评估评分预测是否精准的指标,整体的思路是计较预测值和真实值之间的误差,然后把误差尽大概节制在可接管范畴之内。

凡是环境下会用均方根误差(RMSE)、均方误差(MSE)、平均绝对误差(MAE)来权衡。

详细计较 *** 不赘述,感乐趣的可以自行相识下。

2. 分类精确率

主要是针对行为预测的,一般用TopN的精确率和召回率来举办权衡。

召回率:但愿包围的案例中,实际被包围的有几多好比想从1万条新闻中识别所有的军事类新闻,召回率为80%意味着只识别出来了8000条新闻。

精确率:计策包围的案例中,真正但愿被包围的有几多;从1万条新闻中识别出100条军事类新闻,精确率为80%意味着只识别出来了80条军事新闻。

召回率和精确率是彼此抵牾的,召回率高,精确率大概会低,精确度高,召回率大概会低;需要团结产物阶段和优化方针去找一个符合的均衡点。

3. 排序指标

凡是回收AUC值, AUC值在数学上等价于模子把体贴的那一类样本排在其他样本前面的概率。

更大是1,完美功效,0.5就是随机分列,0就是完美地全部排错,最差的是靠近0.5。

另外还可以通过方针值和AB测试来举办权衡,好例如针值是逗留时长,那就用逗留时长的巨细来举办权衡,线上情况可以通过差异的流量比拟结果。

4. 贸易指标

主要就是我们期望晋升的一些方针值,好比:

比例类:点击率、转化率、留存率、完播率等;

绝对值类:用户逗留时长、GMV(成交金额)、社交干系数量等。

再来看广度,凡是会有包围率、失效率、新颖性、更新率、风行度等。

5. 包围率

主要指的是推荐系统在几多用户身上乐成运用了,好比总共有100W用户,A计策包围用户数量是10W,那包围率就是10%。

凡是环境包围率为UV包围率可能PV包围率:

UV包围率:有效推荐包围UV/总UV。

PV包围率:包围PV/总PV。

6. 失效率

主要是权衡不出推荐功效的环境,好比计策A包围了10W用户,有1W用户是没有推荐功效的,那对应的失效率就是10%。

失效率也分为UV失效率和PV失效率:

UV失效率:推荐功效列表长度为0包围的UV/整体UV。

PV失效率:推荐功效列表长度为0包围的PV/整体PV。

7. 新颖性和惊喜性

直观上的领略就是用户没见过(新颖),更好还能是用户感乐趣可能喜欢的(惊喜)。

这个时候需要把维度不绝的细化,好比细化到主题、分类、标签等,然后再权衡每个维度上用户没见过物品的比例。

8. 更新率

主要是权衡每个推荐周期和上个周期对比,推荐列表中差异物品的比例。

相关文章

推荐系统分析:猜你喜欢是怎么产生的?

推荐系统分析:猜你喜欢是怎么产生的?

本文将从最简单的概念开始,逐步讲解推荐系统的发展历程和最新实践。以产品经理的视角,阐述推荐系统涉及的算法,技术和架构。本章是第一章,将先概括性介绍推荐系统。 推荐系统是迄今为止,人工智能,大数据和云...

一文读懂推荐系统用户画像

一文读懂推荐系统用户画像

本系列文章将从最简朴的观念开始,慢慢讲授推荐系统的成长过程和最新实践。以产物司理的视角,叙述推荐系统涉及的算法,技能和架构。本文将先容推荐系统如何给现实世界中的用户打数字化的标签:用户画像。 用户画...

这10个评价指标,可以带你认识推荐系统

这10个评价指标,可以带你认识推荐系统

跟着移动互联网的飞速成长,网络中的信息量呈指数式增长,大量的商品、资讯、常识、视频、音乐等内容和资源可供用户选择,信息过载问题日益突出。 而推荐系统是办理信息过载最有效的方法,因此,基于大数据的推荐...

深度学习应对推荐系统,必须懂的3个层面

深度学习应对推荐系统,必须懂的3个层面

撰写推荐系统的文章多如牛毛,笔者准备撰写推荐系统产品的文章除了以下4点原因外,更是因为推荐系统已经从传统的推荐系统升级到智能的以深度学习驱动的深度推荐系统为主的旋律。有了这一与网上推荐系统文章立意不同...

如何设计一款百万日活的推荐系统(1)—大智慧RES从0到1实战

如何设计一款百万日活的推荐系统(1)—大智慧RES从0到1实战

编辑导语:百万日活的推荐系统是许多人可望而不行求的,其系统的设计也并不简朴,那么该如何设计这样一款推荐系统呢?本文作者基于本身的实际搭建履历,为我们分享了他的产物设计过程,但愿可以或许辅佐各人在系统搭...

「推荐系统」评估指南,准≠好

「推荐系统」评估指南,准≠好

编辑导语:许多人城市有这样的经验,在淘宝刚搜了一个商品后,推荐里就会呈现大部门雷同的商品;可能你购置了一个商品后,会瞥见此商品配件的推荐;这就是推荐系统,推荐系统是如何举办评估?怎么评估才不会引起用户...