如何定性内容?先有标准后有天,用算法的眼光看内容

访客4年前黑客工具986

定制尺度也是一门技能活,并非纯真摆列条款那么简朴。本文作者用一个内容尺度的实例来跟各人表明,看奈何的内容尺度才是及格的,一起来看看~

如何定性内容?先有尺度后有天,用算法的目光看内容

有一条视频描写了这样的场景:在某综艺节目中,一个篮球明星演出踢足球。

那么这条内容应该属于什么主题符合呢?

运营甲认为是综艺,因为视频的上下文是综艺节目;运营乙认为是足球,因为视频内主要的勾当是在踢足球;运营丙则认为是篮球,因为主要人物是个篮球明星。

公说公有理婆说婆有理,各人各自为政最后无法形成共鸣,各自按各自的想法事情,导致统计口径纷歧致,严重影响业务的判定。

1. 为什么需要尺度?

内容识别主要运用在内容分发和内容决定两个方面,在分发之前系统需要操作法则可能模子识别出内容的特征,利便给用户匹配感乐趣的内容。

以主题分类为例,我们需要一个模子可以或许自动识别一篇文章的主题是新闻、体育照旧其它。而模子的练习很洪流平上依赖于样本的标注,假如标注同学没有依据统一的尺度举办标注,那标注的精确率就会很低,而以这些低精确度样本练习的模子精确率一定更低,这将直接导致主题模子不行用。

从内容决定的角度,错误的识别功效将直接导致错误的运营决定。假设上面练习出的错误模子会把新闻类的内容都标注成体育,这样运营人员误觉得体育类内容很受接待从而大力大举引入、培植体育类内容。最后不单导致挥霍了大量资源,并且用户真正感乐趣的新闻类内容受到挤占,体验也相应地变差。

“标”是投射器,“准”是靶心。尺度适用,意为行为和功效要相符,常用于家产出产规模。

国度尺度GB/T 3935.1—83界说:

“尺度是对反复性事物和观念所做的统一划定,它以科学、技能和实践履历的综合为基本,颠末有关方面协商一致,由主管机构核准,以特定的形式宣布,作为配合遵守的准则和依据。”

从国标的界说可以看出尺度针对反复性的事物,团结实践,目标是让参加各方告竣一致配合遵守。尺度的一般泛起形式是一个文档,可以附带表明说明的文件。

对付给内容分类打标这样反复性的事情,主观性极强,假如不能统一参加同学的想法,打标结果就会有很大的水分。并且后头新来的同学也不能操作之前积聚的履历,一开始事情大概无从下手,效率极低。

因此我们需要套用家产规模的尺度,在内容规模成立内容尺度,统一所以参加者的判定,呈现纷歧致的环境下也能有据可依。

2. 如何拟定尺度

定制尺度也是一门技能活,并非纯真摆列条款那么简朴。我们接下来聊聊什么样的内容尺度才是及格的,并用一个内容尺度的实例来加以说明。

(1)尺度的尺度

尺度的焦点方针是让利用者可以或许快速与尺度的描写告竣一致,为了制订提高尺度的质量和效率,可以给尺度也类型尺度,这样在后续制订各类差异尺度的时候就有了参考依据。

明晰方针:首先需要明晰的是尺度的方针,整个尺度主要面向什么范例的内容,有什么目标。让利用者充实意识到它的利用场景和代价,这样有利于尺度后续的敦促和执行;

描写清晰:尺度的描写语言只管客观中立,不容易引起歧义,用定性的语言让利用者大抵相识描写的是什么样的内容,给利用者一个大抵的预期。可是定性描写照旧暗昧的,这时候需要定量描写来增补说明。如判定图片恍惚的尺度有两条候选。之一条是“图片恍惚不清”;而第二条则更细致,“人物五官不清晰,呈现明明的锯齿或马赛克或图片一半以上的面积恍惚不清”。双方比拟显然后者不容易发生歧义,利便执行;

抓大放小:尺度创作者的精神和常识有限,不行能穷举所有的环境。因此优先描写主要环境,对付不常见的环境可以忽略或简朴描写。至于哪些是常见环境可以抽样统计得到;

突出案例:如同英美法系以判例为重要依据,在尺度的条款中插手真实的案例远比文字描写越发活跃形象。值得留意的是反例和正例一样重要,反例就是那些容易堕落的例子,插手到尺度中有助于制止此类环境产生;

明晰界线:对付恍惚有歧义的环境可能常常被误判的环境该当专门加以说明。

(2)一个典范的尺度

下面展示一个实际被运用且切合上诉尺度的“恶心(gross)内容尺度”,由于案例图片大概引起读者不适就不在此泛起,可是真实尺度中需要浮现:

1)尺度方针

相关文章

数据产品经理的入门手册:如何评估数据产品的上线效果?

数据产品经理的入门手册:如何评估数据产品的上线效果?

一个好的产物通过产物评估才气权衡其产物结果及业务代价,那么对付数据产物来说,我们怎么对齐评估呢?本文作者同各人分享一套合用于数据产物的评估体系,解答如何评估数据餐品的产物结果。 对付数据产物司理来说...

Adobe Flash 浮沉录(下)

Adobe Flash 浮沉录(下)

编辑导读:Adobe Flash退出汗青舞台,有人唏嘘,有人感应,有人遗憾。基于此,本文作者回首了Adobe Flash20多年的汗青沉浮,但愿对你有辅佐。 篇幅干系,我们分两部门刊出,此为第二部门...

这些原子设计理念,设计师要懂!

这些原子设计理念,设计师要懂!

编辑导读:一些设计师在设计产物时会用警惕此外大厂的设计系统,对本身的产物举办拆解,这样的做法只是知其然不知其所以然。原子设计理论的呈现就是为了辅佐设计师去搭建属于本身的设计系统,在海内大厂中应用较量遍...

微博PUSH策略:调研分析&优化方案PRD

微博PUSH策略:调研分析&优化方案PRD

计策产物已经是一门体系较为完善的学科,想进修的小同伴可以通过搜索引擎查找相关课程。本系列文章不讲要领论,只分享亲手阐明的案例。着重展示思路,但愿可以给各人带来一些参考和开导。 调研时间:2018.1...

“燥热”的私域流量,B端的“双黄连”?

“燥热”的私域流量,B端的“双黄连”?

私域流量概念的走俏本身有自己的走红依据。但如果真的各行都在跟风私域流量,各种成功学再次涌现,这我们恐怕得警惕一下里面可能存在的泡沫了。 “即使一个个有自己独立见解的人,一旦他们加入受人民崇拜意识形态...

Web后台产品的表单页规范

Web后台产品的表单页规范

编辑导读:不管是APP照旧网页端,表单页都是常常用到的成果之一。网页端PM需要相识常见表单页的相关类型,作者按照多年的履历总结出了通用逻辑和文档类型,但愿对你有所开导。 表单页凡是由多种输入组件和提...