产品经理如何快速定位「数据异常」问题?

访客4年前黑客资讯1267

作为产物司理,存眷数据是一项根基事情。事情里经常会呈现存眷的指标或数据呈现颠簸,可能在阐明某个成果时发明难以领略的数据的环境,这时候我们需要去阐明数据颠簸的原因,而我也和各人分享一下我的阐明思路。

产物司理如何快速定位「数据异常」问题?

1. 确认数据源精确性

许多时候数据的问题仅仅是数据的问题。假如碰着一个数据颠簸或异常我们无法简朴地阐明出原因时,大概就要想想是不是数据源出了问题。

数据源大概是我们的业务数据库,如商品价值、销售额这些数据;也大概来自用户行为,如用户的点击、欣赏等事件,这些数据源都极有大概呈现问题,譬喻业务数据库同步呈现问题,用户行为的收罗、上报禁绝确等等。

有时候我们一股脑地从产物角度去阐明,最后确实数据自己的问题,会做许多无用功。所以碰着一时间阐明不出原因的问题,首先要思量是不是数据源呈现问题。这时候就得接洽公司的数据产物司理、前后端行为上报方、大数据的研发确认。

一般有以下几个常见的因素会导致数据源精确性问题:

前端上报的事件与产物的界说不符:譬喻有的页面大概会预加载,从产物的角度看,预加载是技能的处理惩罚 *** ,不能算是用户的行为。可是前端往往会将预加载的事件不做区分地上报,导致数据与预期不符。

处事器重构/技能优化:处事器的工程师们不时会举办技能优化,这部门优化产物经常是难以感知的,同时又容易造成数据颠簸。譬喻有一次我司的Push发送量溘然大增,定位问题发明是技能大大们对发送Push的处事器举办了优化,优化后方针用户量稳定,单元时间发送量(QPS)提高,导致原本在规按时段内(如20:00~22:00)没有发完的push此刻可以全量发完了。

大数据统计逻辑:产物利用的数据往往不是底层数据,而是大数据组研发们在底层数据基本长举办的聚合,在这个进程中,就有大概呈现界说纷歧致的环境。这类问题发起先与数据产物司理相同,按照我的履历,除非产物司理对数据侧较量相识,不然直接与数据组的研发相同,相同效率会较量低。

2. 维度下钻阐明

要摸索一个指标异常的原因,一个十分重要的东西就是维度下钻。通过从差异维度和差异力度的下钻,我们可以或许一步一步靠近问题的本质。

譬喻一个页面的UV占比不绝的下跌,我们就可以重新/老用户、页面各个进口流量、页面各板块点击等维度下钻举办阐明,定位问题。

好比说我们通过新/老用户区分阐明发明新用户进入该页面UV呈现了显著下降,而老用户较为不变,则可以揣摩是新用户的引导方面呈现了问题。

3. 抓住重要节点

第三点其实也属于第二点的一种环境,是从时间的维度去阐明问题——数据凡是都是会在一个时间点开始产生变换,这时候我们就得去研究这个时间点产生了什么事,是上线了新版本,照旧调解了数值,可能有什么勾当开始了。

无论是维度下钻或是抓住重要节点,本质上其实是通过比拟找到问题。差异时间段的纵向比拟,差异用户群体的比拟,同业务线差异产物数据比拟,都是我们快速定位数据问题的利器。

4. 一连性迟钝变革

最难的一种数据问题是迟钝变革的数据,即数据没变革没有明明的时间节点。这种问题是最难定位的。呈现这种环境时,需要思量一些跟着时间改变会逐渐优化/恶化的因素。

譬喻我们公司有一次呈现了一个指标长达3个月的迟钝小幅下降,或许每一周下降0.5个点,各人抓破脑壳研究好久今后,终于找到原因:我们利用了数美的一款异常用户拦截产物,这款产物自身会按照大数据不绝优化,提高拦截精确性,拦截率会随时间迟钝晋升,从而导致我们相关指标的不绝下降。

所以这种异常会跟一些会随时间迟钝变革的因素相关,譬喻推荐算法的不绝进修,用户习惯的迟钝改变等等。

5. 不要想虽然,不放过任何细节

有时候原因就在面前,只是我们想虽然地以为不行能是它,于是视而不见。

有一次我们的产物新增留存溘然下降4%阁下,这算是一个很是严重的问题了。老板紧张召集各认真人阐明人,在颠末八仙过海各显神通的群策群力后,解除了各类原因,发明数据变革的时间点与新版本宣布有关。最终找到问题地址是新包内容比旧包增加了30mb阁下,用户更新内容时会在更新页面多期待数十秒,因为增加的这几十秒导致敏感的新用户流失了4%阁下。

在一开始,所有人都想虽然地以为这30M的体积不会造成如此大的影响,产物团队在解除去险些所有大概的因素,才在最后定位到这个问题。

新用户是最敏感的用户群体,任何期待、瓦解、体验不佳都大概导致用户留存下降。

相关文章

数据指标出现异常波动时,你该如何进行异常分析呢?

数据指标出现异常波动时,你该如何进行异常分析呢?

当APP产物业务线的某个数据指标呈现异常的颠簸时,该如何着手数据异常阐明呢? 在日常的事情中,我们常常会碰着“产物XX数据指标呈现异常颠簸,或上升或下跌”的问题,XX指标包罗但不限于日活、越日留存率...