PRODUCT CLASSIFICATION
產(chǎn)品分類生物信息學主要應用到HMM隱馬可夫鏈的方法。數(shù)學中具有馬爾可夫性質的離散時間隨機過程。該過程中,在給定當前知識或信息的情況下,只有當前的狀態(tài)用來預測將來,過去(即當前以前的歷史狀態(tài))對于預測將來(即當前以后的未來狀態(tài))是無關的。在馬爾可夫鏈的每一步,系統(tǒng)根據(jù)概率分布,可以從一個狀態(tài)變到另一個狀態(tài),也可以保持當前狀態(tài)。狀態(tài)的改變叫做過渡,與不同的狀態(tài)改變相關的概率叫做過渡概率。隨機漫步就是馬爾可夫鏈的例子。隨機漫步中每一步的狀態(tài)是在圖形中的點,每一步可以移動到任何一個相鄰的點,在這里移動到每一個點的概率都是相同的(無論之前漫步路徑是如何
1 評估問題
給定觀測序列O=O1O2O3…Ot和模型參數(shù)λ=(A,B,π),怎樣有效計算某一觀測序列的概率,進而可對該HMM做出相關評估。例如,已有一些模型參數(shù)各異的HMM,給定觀測序列O=O1O2O3…Ot,我們想知道哪個HMM模型zui可能生成該觀測序列。通常我們利用forward算法分別計算每個HMM產(chǎn)生給定觀測序列O的概率,然后從中選出*的HMM模型。
這類評估的問題的一個經(jīng)典例子是語音識別。在描述語言識別的隱馬爾科夫模型中,每個單詞生成一個對應的HMM,每個觀測序列由一個單詞的語音構成,單詞的識別是通過評估進而選出zui有可能產(chǎn)生觀測序列所代表的讀音的HMM而實現(xiàn)的。
2 解碼問題
給定觀測序列O=O1O2O3…Ot和模型參數(shù)λ=(A,B,π),怎樣尋找某種意義上*的隱狀態(tài)序列。在這類問題中,我們感興趣的是馬爾科夫模型中隱含狀態(tài),這些狀態(tài)不能直接觀測但卻更具有價值,通常利用Viterbi算法來尋找。
這類問題的一個實際例子是中文分詞,即把一個句子如何劃分其構成才合適。例如,句子“發(fā)展中國家”是劃分成“發(fā)展-中-國家”,還是“發(fā)展-中國-家”。這個問題可以用隱馬爾科夫模型來解決。句子的分詞方法可以看成是隱含狀態(tài),而句子則可以看成是給定的可觀測狀態(tài),從而通過建HMM來尋找出zui可能正確的分詞方法。
3 學習問題
即HMM的模型參數(shù)λ=(A,B,π)未知,如何調整這些參數(shù)以使觀測序列O=O1O2O3…Ot的概率盡可能的大。通常使用Baum-Welch算法以及Reversed Viterbi算法解決。
elisa試劑盒,進口elisa試劑盒,國產(chǎn)elisa試劑盒,elisa試劑盒,明膠酶譜法試劑盒,白介素Elisa試劑盒,睪酮檢測試劑盒,雌二醇檢測試劑盒,進口elisa試劑盒 -上海信帆生物科技有限公司
郵箱:1170233632@qq.com
傳真:021-51870610
地址:上海市顧戴路2988號B幢7樓