AI产品经理必修:揭开算法的面纱(隐含马尔可夫)

访客3年前黑客工具446

隐马尔可夫模子今朝连续乐成地应用于呆板翻译、拼写纠错、手写体识别、图像处理惩罚、基因序列阐明等规模。近20年来,它遍及应用于股票预测和投资。本文丢弃那些目眩凌乱的数学公式,去看看隐含马尔可夫模子到底是什么?怎么用?

AI产物司理必修:揭开算法的面纱(隐含马尔可夫)

相信只要是涉足人工智能规模,你城市听到这样一个神秘的名字-隐含马尔可夫模子。是的,看了一圈文章和资料后,除了知道马尔可夫是个智慧绝顶的人,其他的就啥也不知道了。

正式开讲之前,先或许相识一下,这个算法有哪些主要的应用场景。

一个词归纳综合,举办预测。

20世界80年月末李开复僵持回收隐马尔可夫模子的框架,乐成的开拓了世界上之一个大词汇量持续语音识别系统sphinx。接下来,隐马尔可夫模子连续乐成地应用于呆板翻译、拼写纠错、手写体识别、图像处理惩罚、基因序列阐明等规模。近20年来,它遍及应用于股票预测和投资。

本日,我想丢弃那些目眩凌乱的数学公式,去看看隐含马尔可夫模子到底是什么?怎么用?

一、隐含马尔可夫模子是什么?

我们照旧分成三个阶段来相识。

观念一:马尔可夫假设

随机进程中各个状态st的概率漫衍,只与它前一个状态st-1有关。

举一个例子,我们可以把S1 , S2 ,S3…St…看做北京天天的更高气温,这内里的每个状态St都是随机的。理论上,任何一天的更高气温St取值都大概和这段时间以前的更高气温是相关的。

马尔可夫这个大神为了简化问题,做出了如上图的简化的假设。回到上面的例子,第二天的更高气温只跟昨天有关而与其改日期没有任何干联。

观念二:马尔可夫链

切合马尔可夫假设的随机进程称为马尔可夫进程,也称为马尔可夫链。

AI产物司理必修:揭开算法的面纱(隐含马尔可夫)

在这个马尔可夫链中,四个圈暗示四个状态,每条边暗示一个大概的状态转换,边上的权值是转移概率。

譬喻:某个时刻t的状态St是m2,则下一个时刻St+1=m3的概率是0.6,用数学标记暗示是P(St+1=m3|St=m2)=0.6。

把这个马尔可夫链想象成一台呆板,它随机选择一个状态作为初始状态,然后凭据上述法则随机选择后续状态。

功效大概如下:

S1=m1S2=m2   S3=m3  S4=m4

S1=m2  S2=m4    

S1=m3  S2=m3   S3=m4  

……

这样颠末一段时间的运转,就会发生一个状态序列S1,S2,S3… St。我们可以数出mi呈现的次数,以及mi转换到mj的转移概率。基于马尔可夫假设,每一个状态只与前一个状态相关,譬喻从m3 转移到m4,岂论在此之前是怎么进入m3,这个概率都是0.3。

观念三:隐含马尔可夫模子

隐马尔可夫模子是上述马尔可夫链的一个扩展:任一时刻t的状态st是不行见的。所以调查者没法通过调查到一个状态序列s1,s2,s3,…sT-1来猜测转移概率等参数。可是,隐马尔可夫在每个时刻t会输出一个标记ot,并且ot和st相关并且仅和st相关。这个被称为独立输出假设。

隐马尔可夫模子布局如下:

AI产物司理必修:揭开算法的面纱(隐含马尔可夫)

个中包括的状态s1,s2,s3,s4是一个典范的马尔可夫链。鲍姆把这种模子称为“隐含”马尔可夫模子。

那么,问题来了,什么是隐患状态?

从马尔可夫链中,我们看到的都是可见状态啊。这个问题真的困扰了我好久,我找了大量的资料,发明照旧这样一个经典例子可以或许表明得清楚,请看:

假设我手里有三个差异的骰子。之一个骰子是我们泛泛见的骰子(称这个骰子为D6),6个面,每个面(1,2,3,4,5,6)呈现的概率是1/6。第二个骰子是个四面体(称这个骰子为D4),每个面(1,2,3,4)呈现的概率是1/4。第三个骰子有八个面(称这个骰子为D8),每个面(1,2,3,4,5,6,7,8)呈现的概率是1/8。

AI产物司理必修:揭开算法的面纱(隐含马尔可夫)

此刻,我们开始掷骰子,获得如下功效:

AI产物司理必修:揭开算法的面纱(隐含马尔可夫)

看出来了吧?什么是隐含状态?掷出来的数字是可见的,可是每次取哪个骰子,我们是不是不知道?

回到隐含马尔可夫模子,标记ot就是我们掷出来得数字(1,2,3,4,5,6,7,8),隐患状态st就是我们掷得骰子(D6,D4,D8)。

此刻,我们以掷骰子为例,来总结一下隐患马尔可夫模子得几个组成要素:

可见状态集:D6的可见状态集(1,2,3,4,5,6),D4的可见状态集(1,2,3,4),D8的可见状态集(1,2,3,4,5,6,7,8)

隐患状态集:上图中的隐含状态集为D6,D8,D8,D6,D4……

初始(隐含)状态转移概率:好比,之一次拿到D6,D4和D8的概率别离是0.1,0.4,0.5。

(隐含)状态转移概率:好比,我们可以这样界说,D6后头不能接D4,D6后头是D6的概率是9,是D8的概率是0.1。

相关文章

中国互联网2020年鉴:上半年推直播,下半年抢搜索

中国互联网2020年鉴:上半年推直播,下半年抢搜索

编辑导读:刚已往的七月,腾讯将要全资收购搜狗的动静发布,引起了各人的存眷。腾讯为什么要收购搜狗?搜索引擎这个“老产品”在本日的互联网尚有什么代价?本文作者从行业出发,对搜索业务的近况展开了梳理阐明,一...

服务数字化转型(六):B2B服务转型

服务数字化转型(六):B2B服务转型

编辑导语:数字化转型,是操作现代技能和通信手段,改变企业为客户缔造代价的方法;B2B应该怎么做数字化转型 ?本文作者分享了关于B2B处事转型的一些思考,我们一起来看一下。 笔者在《营销和处事数字化转...

拼多多产品分析 | 下沉市场破局和发展

拼多多产品分析 | 下沉市场破局和发展

编辑导语:拼多多主打下沉市场,以“拼”和“百亿津贴”着名,平台通过满减、秒杀、转发、砍价等等方法刺激用户消费,同时促成裂变;本文作者分享了关于拼多多的具体阐明,以及下沉市场的破局和成长,我们一起来看一...

15个问题,带你了解直播带货的真相

15个问题,带你了解直播带货的真相

文章梳理总结了关于直播与短视频、卖货与营销的15个问题,包罗影响销售转化率的焦点因素、直播卖货和短视频卖货等方法最大的区别以投放计策等等。 疫情以来,无数企业产生了天翻地覆的变革,最抢眼的就是借助直...

技术人员需要有产品思维吗?怎么锻炼?

技术人员需要有产品思维吗?怎么锻炼?

编辑导读:产物思维是一种办理问题的综合思维,是进一步把问题办理方案产物化的进程。具备产物思维不只可以或许辅佐技能人员更好地与产物举办相同,对其自身的职业成长也有长处。那么,技能人员如何快速晋升对产物常...

“贩卖”国潮新鲜感的花西子、完美日记们,能炒多久?

“贩卖”国潮新鲜感的花西子、完美日记们,能炒多久?

编辑导读:近些年,涌现了许多新兴品牌,他们的配合特点就是给消费者带来了国潮新鲜感。国潮作为新的消费时尚,受到年青人的追捧和喜爱,“嗅觉敏捷”的品牌方们早就挖掘到了个中的可图之处,花西子、完美日记就是个...