企業(yè)網(wǎng)站建設(shè) 新聞宣傳關(guān)鍵詞有哪些
E:Expection,期望步,利用估計(jì)的參數(shù),來確定未知因變量的概率,并利用其來計(jì)算期望值。
M:Maximization,最大化,使用最大似然法更新參數(shù)值,使E步中期望值出現(xiàn)的概率最大。
例如網(wǎng)上較多的硬幣例子,可以先估算硬幣正反面參數(shù)A,但是無法獲知隱變量B(無法知道某一次實(shí)驗(yàn)選擇哪一枚硬幣),因此可以分別計(jì)算每次試驗(yàn)選擇了某一枚硬幣的概率,也就是說計(jì)算了隱變量B的概率。明確了隱變量B的概率后,就可以依此概率,計(jì)算出一個(gè)期望值E。
通過更新參數(shù)A,使期望值為E的概率最大化,也就是M步中“最大化”的含義。
可以參考鏈接,https://zhuanlan.zhihu.com/p/78311644,這里面詳細(xì)記錄了硬幣案例的EM迭代過程。
同樣,將情況復(fù)雜化,例如現(xiàn)在有2位男生和2為女生,數(shù)據(jù)記錄了他們的身高(但是不知道被記錄著的性別),需要分別估計(jì)男女生身高分布的均值和方差,
這個(gè)時(shí)候有人就想到我們必須從某一點(diǎn)開始,并用迭代的辦法去解決這個(gè)問題:我們先設(shè)定男生身高和女生身高分布的幾個(gè)參數(shù)(初始值),然后根據(jù)這些參數(shù)去判斷每一個(gè)樣本(人)是男生還是女生,之后根據(jù)標(biāo)注后的樣本,計(jì)算出一個(gè)期望值,然后反過來重新估計(jì)參數(shù),使期望值出現(xiàn)的概率最大化。之后再多次重復(fù)這個(gè)過程,直至穩(wěn)定。這個(gè)算法也就是EM算法。
https://zhuanlan.zhihu.com/p/56377602