培养数据意识,从数据口径字典开始

访客4年前黑客工具339

信息社会,数据量日益复杂。对付产物司理来说,怎么样找准需要阐明的数据去敦促业务指标的告竣,怎么样造就数据意识是必备的技术。对付应届产物来说,可以从整理数据口径字典开始。

造就数据意识,从数据口径字典开始

上个月将修改好的metabase报表上线了,意识到数据口径字典的统一尺度化的重要性是从一个需求宣布到正式情况出问题开始的。这个需求上线后,发明某张统计表和明细表的数据数对不上,这时候需要测试协助去找出对不上的某几条数据,再一遍遍去找到问题-修改-从头发版。

这一切的源头,是产物对付数据界说和取数的不类型导致的。所以通过整理数据口径字典这个需求,但愿领略为什么要做,怎么做以及怎么维护,从而去造就基本的数据意识。

一、 为什么做数据字典-why

之一个是实际场景需要的原因。在差异的数据报表中呈现沟通的数据名,可是界说纷歧致;在差异的数据报表中呈现差异的数据名,可是界说一致。所以会导致在导出数据时会因呈现沟通数据名但界说差异而发生的数据不匹配现象。

第二个是业务数据类型的原因。由于我们公司的业务数据较多,假如将差异的业务数据糅合在一张内外存储,会造成数据的冗余、表关联的数量增多而呈现关联堕落的误操纵、修改某几个数据时要同时处理惩罚多张表等问题。

因此我需要从整理数据口径字典开始,去为转先容宽表做铺垫。把沟通业务的所有数据放在同一张表中,目标在于提高数据提取的效率,便于后续迭代。

造就数据意识,从数据口径字典开始

二、怎么做数据字典-how

数据口径字典整理的重点,我梳理主要有以下四点。

数据口径和界说的从头规整,数据名和界说只管做到清晰、明晰、易懂,数据泛起名目也需记录;

数据口径的原界说取数逻辑和现界说取数逻辑的记录,让后续开拓和产物查找有迹可循;

确认数据口径界说是否与业务方告竣一致,制止歧义

需涵盖尽大概多的相关业务数据,规整差异种别,形成一本可查询的字典

三、转先容数据口径字典-what

以详细的转先容业务,总结是如何成立数据口径字典的。

1. 梳理现有业务报表中和转先容口径相关的口径,按照优先级提需求记录开拓取数

之一步是对付业务场景熟悉相识的要领,通过整理已有数据口径,可以快速相识现有业务包括什么内容,也是应届生熟悉业务快速上手的一个好要领。

记录已有口径(包罗原数据口径、原界说、名目、),并记录开拓取数(记录的是实际数据库的哪张表的哪个数值以及文字描写记录),目标是在于后续为新口径记录开拓取数时,开拓同事可知道其时实际取数来历,提高效率。

2. 给转先容数据口径从头定名和界说

业务线。先要明晰现有这个业务主要分哪几大类,业务线是作为数据口径字典的更大维度。

数据口径名称。在整理时是认为名称越清楚越好。详细什么是清楚的名称,需要按照详细业务来描写。举一个例子,「学员正式课报名时间」。之一回响是:这个学员指的是什么学员?什么样的行为叫做报名?正式课有分首付和全付,这里是哪种?。因此这个口径名称就是不贴合业务,容易让业务方发生误解并导致数据禁绝确的名称。因此按照详细业务,需要做详细维度分别。

造就数据意识,从数据口径字典开始

数据界说。在清楚的数据口径基本上,界说根基上是对数据口径的具体描写,以及增补现有业务对该维度数据的法则。需要留意是(如下图),一个是:每个数据口径都是存在于metabase报表中的,需明晰这个报表是统计表照旧明细表,以便给后续产物和开拓知道是获取某个字段照旧统计某些字段。另一个是:对付数据口径A与数据口径B是有关联的,需要在通用界说后备注具体界说。

造就数据意识,从数据口径字典开始

3.  和业务方确认口径和界说无误后,即可开拓记录新界说的取数了

在这进程中开拓大概会不绝询问关于数据口径的界说,到底要哪个数值;取得是哪张表;大概会呈现什么环境是本身之前没有思量到的,这样的进程也能辅佐我更深领略数据口径的界说和个中逻辑。

4. 校验

完成取数后的校验也是很重要的。大概由于数据口径的庞洪水平,关联表数量的几多和操纵进程中的类型性,导致数据口径存在取数错误的环境,因此我通过校验明细表和统计表的沟通一项数据口径来确认是否存在取数错误。

四、日后维护数据字典

相关文章

认识需求,才能更好的权衡与决策

认识需求,才能更好的权衡与决策

编辑导语:需求对付产物司理来说是一个老生常谈的话题了,无论你做到了什么地位、开始了一个什么样的项目,事情往往都需要环绕需求展开。因此对需求举办精准的衡量和决定,这对付产物司理来说是至关重要的。本文作者...

新零售行动派:鸡毛换糖走向数智化

新零售行动派:鸡毛换糖走向数智化

流转的是岁月,稳定的是精力。 改良开放之初,浙江人鸡毛换糖,用手中的拨浪鼓摇出奇特的浙江财富集群和电商基因,而浙江当局,也为浙江人的创新提供最重要的气候情况和泥土条件。 互联网时代,浙江用开放海涵的...

项目开始之前,产品经理要先确定产品定义

项目开始之前,产品经理要先确定产品定义

许多项目在缺少须要相同、约定的环境下就仓皇开始了,乃至在项目举办中失去偏向,因为各类原因产物司理无法在项目历程中加以扭转,最终很大概导致项目烂尾甚至失败。开始前必然不要忘了,我们到底要干什么。 01...

数据产品系列之(1):为什么数据产品经理的市场需求在增加?

数据产品系列之(1):为什么数据产品经理的市场需求在增加?

数据产物司理的成长今朝还在早期,这样一定会导致市场对数据产物司理的需求在增加,所以这是时机。同样因为此刻还在早期,导致数据产物司理的岗亭成熟度低,对小我私家本领的要求高,但组织不必然能提供系统化的培训...

产品经理学会用思维导图梳理需求,“回怼”BOSS

产品经理学会用思维导图梳理需求,“回怼”BOSS

编辑导读:作为产物司理,你是不是常常会碰着一些无理的需求,尤其提需求的人照旧你的BOSS,你还不能拒绝。这时候除了着急上火尚有什么能做的呢?本文作者也碰着了这样的环境,他用一套思维导读巧妙地“回怼”了...

拼多多没有价格战

拼多多没有价格战

拼多多的乐成并不是因为价值自制,而是它掘客了那些被人忽视的消费市场,并形成了商品制造-畅通-消费的闭环。消费者想要的永远是更自制的商品,电商平台想要得到持久成长,必需摒弃价值战思维。 “所有的直播带...