一文读懂推荐系统用户画像

访客3年前黑客资讯845

本系列文章将从最简朴的观念开始,慢慢讲授推荐系统的成长过程和最新实践。以产物司理的视角,叙述推荐系统涉及的算法,技能和架构。本文将先容推荐系统如何给现实世界中的用户打数字化的标签:用户画像。

一文读懂推荐系统用户画像

用户画像,简朴来讲,就是我们给用户打上的一系列的标签。它的应用很是遍及,在互联网产物的任何一个规模,任何一种实现用户本性化的成果,都需要用到用户画像。本文只涉及推荐系统的用户画像体系。

一、推荐系统用户画像长什么样

用户画像这个词具有遍及性。 它被应用于推荐,告白,搜索,本性化营销等各个规模。任何时候,不管出于什么目标,我们想描写我们的用户是谁的时候,各人城市用到用户画像这个词。

好比:

(1)产物司理定性用户阐明

设计产物成果时,会对用户是谁举办描述。如:方针用户群体的人口属性,社会配景,利用习惯等信息。这种用户画像主要描写用户是谁,以便做好成果定位。

如下图中的定性用户画像分群:

十分钟读懂推荐系统用户画像

(2)数据阐明用户画像

阐明用户行为,用户举办聚类行为阐明。如:数据阐明师大概会给出,寓目电商直播的男女比例,得出女性用户更喜欢看我们的电商直播这样的结论。

(3)推荐系统用户画像

为成立本性化成果,用各类步伐给用户大局限打上几万甚至几千万个标签。这种标签不只仅有偏好,尚有偏好水平值。

本文所指的用户画像,仅仅涉及第三种环境。一般地,推荐系统的用户画像长成这个样子:

十分钟读懂推荐系统用户画像

推荐系统的用户画像,一般包罗用户基本信息和偏好信息。而偏好画像是重点,数量上占了推荐系统用户画像的绝大大都,是我们召回和模子练习的基石。

因为呆板跟人差异,一个词“中国”对付人来说是有意义的,对付呆板只是一个汉字编码。因为用户画像,为了能让呆板计较,需要带上概率值可能偏好值(权重值)等。

我们接下来就聊一聊,在推荐系统中,这种带了一些列数字的用户画像怎么构建出来的。

二、用户画像怎么用?

之一章的先容过,推荐进程分为:召回、初排和精排三个阶段。用户画像主要用在召回和初排两个阶段。

十分钟读懂推荐系统用户画像

召回阶段利用用户画像,主要是通过用户画像召回相似的物品。好比一个短视频APP上,用户海贼王偏好值较量高,就可以针对海贼王举办内容召回。

初排阶段利用用户画像,是在模子上利用的。模子将用户画像数据作为一部门的特征值,用于模子的离线练习可能及时模子更新。

三、用户画像的分类

用户画像是一个较量大而全的观念,标签是用户画像最根基的单位,用户画像是有成千上万个标签组合而成的。当我们想对用户画像举办分类时,通过对用户标签的分类就可以了。每个平台有本身的用户画像体系。对推荐系统的构建来说,一般从以下维度来做标签分类。

如下图所示:

十分钟读懂推荐系统用户画像

个中:

(1)基本用户画像

人口统计学标签:用户的性别,年数,地域等信息。

行为特征标签:用户在互联网平台的注册,活泼,付费,欣赏等方面的行为记录发生的用户标签。

性格标签:豁达大方,一个钱打二十四个结,激动消费等范例标签

(2)偏好用户画像

恒久偏好标签:用户对较长时间内,几个月甚至是几年内,对某类事物的不变偏好。

短期偏好标签:用户最近较短时间内,七天内甚至是几分钟内,对某类事物的偏好。

泛化偏好标签:浩瀚的用户偏好中,差异的偏好之间有关联性可能相似性,就像啤酒和尿布那样。用户对啤酒有过直接的行为,但对尿布还没有,那么尿布大概是他的泛化偏好。

相关文章

罗永浩首秀启示,直播电商与非计划性购物

罗永浩首秀启示,直播电商与非计划性购物

直播电商的“风口”不会因为罗永浩关闭,作为一种融合了直播内容形式和线上购物的结合体,它有自己独特的魅力。 愚人节晚八点,抖音、罗永浩搞了一出大戏,整体数据来看,弱于李佳琦、薇娅,开播第一个小时直播间...

阿里运营有何不同?

阿里运营有何不同?

这大概是没人和你讲过的阿里运营,我担保这是你从未传闻过的——关于阿里运营有什么差异。 许多人都说阿里运营极为与众差异,但是到底与众差异在那里,这次恰好要完成获得大学的打磨功课,我和小组的同学探讨那段...

To B 行业的 MVP:定制开发

To B 行业的 MVP:定制开发

关于介绍 MVP (Minimum Viable Product)的文章有很多,但大多都是 C 端相关的,比如砍掉低频复杂的高级功能,抓住核心流程,找到核心用户验证等等。总之,ToC 的 MVP 强调...

电子发票在公司平台系统与税控开票系统中交互的产品思考

电子发票在公司平台系统与税控开票系统中交互的产品思考

公司具体的电子发票解决方案,要根据公司所处的行业和自身的具体业务进行选择。找到既能满足为公司节省成本、避免让财务人员简单且繁琐的重复性劳动,又能满足让用户快速获取发票,开票不用排队的解决方案。 身在...

数据采集实战:商品详情页数据埋点

数据采集实战:商品详情页数据埋点

编辑导读:通过商品详情页的数据埋点,我们可以越发相识用户,从而为他们提供更好的处事。本文以电商的商品详情页为例,先容如何做数据埋点,但愿对你有辅佐。 用户的数据分为业务数据和行为数据,什么是业务数据...

一种化繁为简的内容梳理与生产逻辑

一种化繁为简的内容梳理与生产逻辑

文章框架逻辑: 01 从「基本内容」到「衍生内容」的逻辑 我们对金融市场上「基本金融资产」和「金融衍生品」的观念举办类比和迁移,因此有了「基本内容」和「衍生内容」的说法。 我们不需要决心领略上图...