浅谈运营工作中的贝叶斯陷阱

bt365体育网址
?

  

 来源:每个人都是产品经理

谈论业务工作中的贝叶斯陷阱

贝叶斯定理广泛应用于各种场景,如机器学习,大数据挖掘,工程分析,金融投资等。本文仅讨论贝叶斯定理在运算数据分析中的思考。

1.什么是贝叶斯定理

件概率(或边缘概率)的定理。

频率学校认为参数存在客观,即使它们是未知的,但它们是固定值并且不会改变。频率学校认为,经过一定数量的重复实验,如果次数和总发生次数趋于一定值,则该比率趋于固定。

最简单的例子就是掷硬币。在一个理想的世界中,我们知道硬币面朝上的概率将倾向于1/2,贝叶斯提出了一个完全不同的概念。他认为概率不应该这么简单。地面计算,但需要考虑先验概率。先验概率意味着我们首先设定一个假设,然后通过某些实验证明/优先于这个假设。这是后路。随后,旧海报将成为一个新的先验。

以下是贝叶斯公式:

P(A | B)是B发生时事件A发生的概率;

P(A)是A的发生概率;

P(B | A)是A的情况下B的出现概率;

P(B)是B发生的概率。

件的前提。估计事件发生的概率。

二,贝叶斯定律的应用

贝叶斯方法对通过证据积累发生对象的概率具有显着影响。它告诉我们,当我们想要预测某个事物时,我们需要首先根据现有的经验和知识(或事实引入先验概率)推断出先验概率,然后在新证据累积时调整这个概率。

让我们通过下面的例子来看看贝叶斯定律的神奇效果。

说患者已经生病了,患者真正生病的可能性是多少? (在你看下面之前,让我们首先通过感觉估计,生病的真实概率应该很高?)

为了便于理解,我们首先通过树形图判断,我们假设有10万人。

件下,患者的真实率是多少?使用真正患病的99作为分子,测量患病的4995 + 99作为分母,99÷(99 + 4995)=1.94%

在这种情况下,使用贝叶斯公式:

P(A1 | B)代表在存在试纸检测疾病时发病的真实概率;

P(A1)代表真实的患者概率,即0.1%;

P(A2)代表健康人群的概率,即99.9%;

P(B)代表试纸检测患者的概率;

P(B | 件下检测患者的概率,即99%;

P(B | 件下试纸被误判为概率的概率,即5%;

替代公式也可以得出结论。

件下发生事件的概率。

三,贝叶斯陷阱分析操作数据1.虚假判断

通过以上案例,每个人都对贝叶斯定律有一定的了解,但普及的概念不是初衷,贝叶斯在运作中有什么应用?说实话,我不知道贝叶斯在作品的运作中必须扮演多少,直到我在上一期的活动中提出以下案例。

我们有一个ace训练营。我们将为每个活动选择一个IT技术方向,设计一系列课程,引导用户每天检查卡片,并在完成学习后获得奖品。活动分为招聘期和课程的两个期间。

在招聘过程中,我们会投入大量的付费或免费渠道,如我们自建的交通池,微信矩阵,外部大站,论坛,SEM等。我们将在所有活动后重新开放报告完成了。

在上一期的过程中,我们发现了一个有趣的数据。在我们训练营的用户肖像中,具有1 - 3年工作经验的开发人员占70%以上。因此,我们在此问题的恢复报告中有以下分析:

参与此次活动的开发人员拥有超过1 - 3年的工作经验,表明我们的课程内容对这些开发人员更具吸引力,并且可以针对此类开发人员的课程设计进行优化。同时,它表明工作1 - 3年的开发人员对自我提升有更多的需求,并且可以在这一组中推广后续工作。

那么,您是否发现了分析这些数据的任何问题?

我们的训练营注册用户的工作寿命为1 - 3年,这是一个结果。件最终会影响我们对整个事物的判断。

2.纠正分析

如果活动分发渠道所涵盖的用户大多是1 - 3年的工作经验,并且自然注册训练营的用户将是该群体的大多数,那么我们对本文的数据审查是错误的,并不能解释我们的该课程对已经工作了1 - 3年的开发人员更具吸引力。如果我们的分销渠道用户均匀分布,并且事件注册用户具有上述分布,那么我们的恢复摘要是有意义的。

在实现上述因素后,我们审查了该活动分配渠道的排水数据:

显然,可以发现自己的流量池的活动是最重要的,申请人的数量占总数的65%。有趣的是,根据我们之前的统计数据,我们自己的交通用户的工作生活肖像为1 - 3年。具有工作经验的用户比例也是最大的,占整个自有流量池用户的一半以上。

因此,在审查了分销渠道的数据后,我们发现初始活动恢复的分析是站不住脚的。

以上是贝叶斯法律运作中的一个小例子。如果你注意这一点,你会发现贝叶斯理论在操作的角落。如果你不小心,我们可能会陷入其中。贝叶斯陷阱不是自我意识的,导致数据分析或整个运营活动的偏差,这反过来影响整个运营战略的制定和调整。

作者:Ziv,写了一个讨厌的运营商。

本文最初由