Ақпарат

Жасырын Марков үлгісі


Мен биоинформатикадан жасырын марковтың моделі туралы оқыдым. Мен оның не екенін түсіне алмаймын. Біреу маған қысқаша және өте қарапайым сөздермен түсіндіре алады ма?

Менің биоинформатикада немесе бағдарламалауда білімім жоқ және бұл туралы Википедия мақаласы өте қорқынышты.


Марков моделі – Марков процесімен жүретін жүйенің сипаттамасы. Марков процесінде жүйенің келесі күйі оның ағымдағы күйінің функциясы болып табылады және оның қайдан және қалай басталғанына байланысты емес. Мысалы, броундық қозғалысты Марков процесі деп атауға болады. Ағымдағы күйден келесі күйге өту ықтималдықтармен сипатталады.

Қорытындылай келе, Марков моделі - бұл жады жоқ деп есептелетін жүйенің ықтималдық моделі.

Жасырын Марков үлгісінде (HMM) жүйенің күйі/күйлері белгісіз (сондықтан жасырын). Дегенмен, күйге байланысты кейбір функциялар бар және олардың шығыстары жүйенің күйін жуықтау үшін пайдаланылуы мүмкін. Анықтама бар - оның әртүрлі ұғымдарға (тек биоинформатикаға ғана емес) қалай қолданылатынын түсіндіру оңай емес.

Негізі бұл тақырыптан тыс. HMM биологиялық ұғым емес. Бұл статистикалық/есептеу тұжырымдамасы (бұл BLAST алгоритмінің негізгі тұжырымдамасы болып табылатын динамикалық бағдарламалаудың не екенін сұрау сияқты).


Жасырын Марков модельдеріне кіріспе және оның биологиядағы қолданылуы

Бірқатар нақты жүйелерде олардың арасында ортақ негізгі үлгілер бар және осы үлгілерді шығару бізді қоршаған ортаны түсіну үшін маңызды. Бұл үлгілер кейбір жағдайларда бақылау кезінде көрінеді, ал басқаларында, әсіресе табиғатта кездесетіндер жақсы жасырылады. Сонымен қатар, бұл жүйелерге тән стохастика жеткілікті шуды тудырады, бізге негізгі үлгіні шешу үшін оны өңдеуге қабілетті үлгілер қажет. Жасырын Марков моделі (HMM) – бақыланатын реттіліктегі жасырын үлгілерді немесе байқалған тізбектер жиынын зерттеу үшін жиі қолданылатын ықтималдық модель. Ол 1960 жылдардың аяғында пайда болғаннан бері биологияда әртүрлі пәндердегі үлгілерді түсіру үшін кеңінен қолданылды, ол кішкентай ДНҚ және ақуыз молекулаларынан, олардың құрылымы мен сәулетінен бастап өмірдің негізін құрайтын көп жасушалық деңгейлерге дейін, мысалы, адамдардағы қозғалыс талдауы. Бұл тарау HMM теориясына, әдетте HMM-мен байланысты статистикалық мәселелерге және олардың биологияда қолданылуына жұмсақ кіріспеге бағытталған.

Түйін сөздер: Баум–Вельч алгоритмі Шығарылу ықтималдығы Күтілетін максимизация Алға-артқа процедура Жасырын Марков үлгісі Үлгі тану Өтпелі ықтималдық Viterbi алгоритмі.


1. Жасырын Марков үлгісі (HMM)

Жасырын Марков үлгісінің не екенін білмес бұрын, Марков тізбегін түсінейік.

Марков тізбегі – әдетте күй деп аталатын кездейсоқ шамалардың реттілігінің ықтималдығын түсіндіретін кездейсоқ процестің үлгісі немесе түрі. Күйлердің әрқайсысы кейбір жиыннан мәндерді қабылдай алады. Басқаша айтқанда, біз оны бұрынғы күйге тәуелді күйде болу ықтималдығы деп түсіндіре аламыз. Біз Марков тізбегін бақыланатын оқиғалар тізбегінің ықтималдығын есептеу қажет болғанда пайдаланамыз. Дегенмен, көп жағдайда тізбек жасырын немесе көрінбейді және әрбір күй кездейсоқ түрде әрбір жағдайдың 1-ін жасайды. к бізге көрінетін бақылаулар. Енді біз жасырын Марков үлгісін анықтаймыз.


Эндрю Мурдың оқулық слайдтары

Бұл оқулықта біз Марков үлгілерін (Марков тізбектері) қарап шығудан бастаймыз, содан кейін. біз оларды жасырамыз! Бұл өте кең таралған құбылысты симуляциялайды. қарапайым және белгісіз динамикаға сәйкес жұмыс істейтін кейбір негізгі динамикалық жүйе бар, бірақ біз оны көре алмаймыз. Біз тек негізгі жүйеден шығатын шулы сигналдарды көреміз. Осы шулы бақылаулардан біз ең ықтимал негізгі жүйе күйін немесе күйлердің уақыт тарихын немесе келесі бақылаудың ықтималдығын болжау сияқты нәрселерді жасағымыз келеді. Бұл ақауларды диагностикалау, роботты локализациялау, есептеу биологиясы, сөйлеуді түсіну және басқа да көптеген салаларда қолданбаларға ие. Оқулықта біз HMM айналасындағы негізінен зиянсыз математикамен қалай бақытты ойнауға болатынын және HMM есептеулерінің көпшілігін тиімді орындау үшін динамикалық бағдарламалау (DP) деп аталатын жүректі жылытатын және орындау оңай әдісті қалай пайдалану керектігін сипаттаймыз. жасағысы келеді. Бұл операциялар күйді бағалауды, негізгі күйлердің ең ықтимал жолын бағалауды және деректерден HMM-ді үйренуді қамтитын үлкен (және EM толтырылған) қорытындыны қамтиды.


Бактериялық плазмидалардың популяциялық биологиясы: жасырын Марков үлгісінің тәсілі

Көлденең плазмидті тасымалдау бактериялардың бейімделуінде негізгі рөл атқарады. Қатаң ортада бактерия популяциялары көлденең генофондтан өздігінен тасымалданатын плазмидалар арқылы генетикалық материалды іріктеу арқылы бейімделеді және бұл жылжымалы генетикалық элементтердің тұрақты болуына мүмкіндік береді. Плазмидалармен кодталған белгілер үшін таңдау болмағандықтан, плазмидалардың бактериялық қауымдастықтарда сақталуы және қалай сақталатыны жақсы түсінілмейді. Мұнда біз селекция болмаған кездегі плазмидтердің тұрақтылығы динамикасының үш моделін ұсынамыз. Модельдер плазмидтердің жоғалуын (бөлу), плазмидтердің құнын, конъюгативтік плазмидті тасымалдауды және бақылау қателігін қарастырады. Сондай-ақ, біз жасырын Марков моделін (HMM) пайдаланып, қоршаған орта процесінің әсерінен кездейсоқ шама ретінде плазмидасыз жасушалардың салыстырмалы жарамдылығы модельденген стохастикалық модельді ұсынамыз. Кең ауқымды модельдеу ұсынылған модельдің бағалауы дерлік бейтарап екенін көрсетті. Ықтималдық-қатынас сынақтары плазмидтердің тұрақтылығының динамикасы хост түріне қатты тәуелді екенін көрсетті. Стохастикалықты есепке алу жеті уақыттық қатардың төртеуін түсіндіру үшін қажет болды, осылайша плазмидтердің тұрақтылығын стохастикалық процесс ретінде түсіну қажет екенін растайды. Бұл жұмысты концептуалды бастапқы нүкте ретінде қарастыруға болады, оның астында плазмидтердің тұрақтылығының жаңа гипотезаларын тексеруге болады.

Фигуралар

Детерминирленген траекториялар үлгісі (сол жақта) және…

Көлденең тасымалдаудың (HT) детерминирленген траекторияларының үлгісі (сол жақта) және өсу қарқыны (оң жақта)…

Төрт бактерияның әрқайсысы үшін…

Төрт бактерия штаммының (H2, R28, P21 және P18) әрқайсысы үшін деректер…

Көлденең үшін тұрақтылық шекаралары…

Көлденең трансфер (HT) моделі үшін тұрақтылық шекаралары, болжалды үлгінің орналасуы…

Имитациялық траектория мысалы…

Айнымалы таңдау (VS) моделі (үшбұрыштар) бойынша имитацияланған траектория мысалы, таңдалған…

Жұмысты бағалау…

HMM параметрін бағалау әдістерінің өнімділігін бағалау. Мың деректер…

Жұмысты бағалау…

HMM параметрін бағалау әдістерінің өнімділігін бағалау. Мың деректер…


Жасырын Марковтың моделі - Биология

Интернеттегі молекулалық биология

Шон Р Эдди
Құрылымдық биологиядағы ағымдағы пікір 1996, 6: 361-365.

Ақуыз құрылымдарының «профильдері» және реттілік туралаулары нәзік гомологияларды анықтай алады. Жасырын Марков моделінің (HMM) әдістерін енгізу арқылы профильді талдау неғұрлым берік математикалық негізге қойылды. Өткен жылы осы қуатты жаңа HMM негізіндегі профильдердің қосымшалары белок құрылымын болжау және кең ауқымды геном реттілігін талдау салаларында пайда бола бастады.

Протеиндердің функциялары мен құрылымдарын тұжырымдау үшін есептеу талдауының маңыздылығы артып келеді [1], өйткені ДНҚ секвенциясының жылдамдығы тізбектердің биологиялық функциясын эксперименталды түрде анықтауға болатын жылдамдықтан әлдеқашан асып түсті. Орнатылған тізбекті салыстыру алгоритмдері белгілі деректер базасы реттілігі мен ағзаға байланысты жаңа ақуыздардың 35-80% арасындағы елеулі ұқсастықтарды анықтайды. Бұл пайызды арттыру өте маңызды. Бір пайыздық тармаққа ұлғайту 2002 жылы аяқталуға жақын адам геномының ретін анықтау уақытына қарай қосымша 700 адам ақуызы туралы пайдалы нәрсені үйренуді білдіруі мүмкін.

BLAST және FASTA сияқты жұптық ретті салыстыру әдістері әдетте барлық аминқышқылдарының позициялары бірдей маңызды деп есептейді, дегенмен позицияға қатысты көптеген ақпарат әдетте қызығушылық тудыратын ақуыз немесе ақуыз тобы үшін қол жетімді. Ақуыздар тізбегі отбасыларының бірнеше реттілігі басқаларға қарағанда көбірек сақталған қалдықтарды және кірістіру мен жою жиі болатын нүктелерді көрсетеді. Үш өлшемді (3D) құрылымдық ақпарат түзетілген қалдықтарды бағалау кезінде құрылымдық орталарды есепке алуға мүмкіндік береді және негізгі қосалқы құрылым элементтеріне қарағанда беттік ілмектерде кірістірулер мен жоюларды жиі күтуге мүмкіндік береді. «Профиль» (позицияға тән қалдық ұпайлары мен кірістіру немесе жою айыппұлдарынан тұратын консенсустың негізгі құрылымы үлгісі ретінде анықталған) жұптық ретті туралау әдістерінен тыс интуитивті қадам болып табылады. Бірнеше ретті теңестіруге [2] [3] [4] немесе 3D құрылымдарға [5] [6] негізделген профильдік әдістерді бірқатар топтар дербес әзірледі және кеңінен қолданылады.

Профильдердің проблемасы - бұл көптеген бос параметрлері бар күрделі модельдер. Біреу бірқатар қиын мәселелермен бетпе-бет келеді: позицияға тән қалдық ұпайларын орнатудың, бос орындар мен кірістірулерді бағалаудың және құрылымдық және бірнеше реттілік ақпаратын біріктірудің ең жақсы жолдары қандай? Соңғы уақытқа дейін бұл сұрақтар әдетте арнайы түрде шешілді. Арнайы баллдық жүйе жеткілікті болуы үшін сынақ және қателік арқылы шебер түрде реттелуі мүмкін, бірақ тұрақты математикалық негіз әлі де қажет.

Жоғарыда аталған сұрақтарды шешу үшін «жасырын Марков үлгілерін» (HMMs) пайдаланатын жаңа профиль әдістері енгізілді. Бұл шолуда мен HMM дегеніміз не екенін түсіндіремін, олардың күшті жақтары мен шектеулерін сипаттаймын және HMM негізіндегі профильдер белок құрылымын болжауда және кең ауқымды геном тізбегін талдауда қалай қолданыла бастағанын көрсетемін.

Дэвид Хаусслер, Андерс Крог және олардың Санта-Крус Калифорния университетіндегі әріптестері барлық профильді әдістерді HMM ретінде көрсетуге болатынын мойындады. Олардың түсінікті техникалық есебі кеңінен таралып, жұмыс 1994 жылдың басында ашық әдебиетте пайда болды [7]. Осы уақытқа дейін басқа топтар HMM негізіндегі профиль әдістерін зерттей бастады [8] [9].

Жасырын Марков үлгілері тізбектер немесе уақыт қатарлары сияқты «сызықтық» есептерге арналған жалпы статистикалық модельдеу әдісі болып табылады және жиырма жыл бойы сөйлеуді тану қолданбаларында кеңінен қолданылып келеді. HMMs бұрын есептеу дәйектілігін талдауда [10], соның ішінде ақуыздың құрылымдық модельдеуіне арналған қолданбаларды [11] [12] пайдаланған. Хаусслердің жұмысы танымал профильді талдау әдістеріне бағытталғаны соншалық, ол HMM-терді кеңірек қауымдастықтың санасына көтерді. HMM формализмінде профильдер мен бос тізбекті туралауларға ресми, толық ықтималдық әдістерін қолдануға болады.

Негізгі идея мынада: HMM - мүмкін болатын тізбектердің шексіз санына ықтималдық үлестірімін сипаттайтын соңғы модель.

HMM теориясының керемет анық сипаттамасын Рабинер жазған [13]. Бірі реттілікті «генерациялайтын» HMM туралы айтады. HMM 3D құрылымындағы позицияларға немесе бірнеше туралаудың бағандарына сәйкес келуі мүмкін бірнеше күйлерден тұрады. Әрбір күй таңба-шығару ықтималдықтарына сәйкес таңбаларды (қалдықтарды) «шығарады», ал күйлер күйге ауысу ықтималдықтарымен өзара байланысты. Кейбір бастапқы күйден бастап, соңғы күйге жеткенге дейін күйдің өту ықтималдығына сәйкес күйден күйге ауысу арқылы күйлер тізбегі жасалады. Содан кейін әрбір күй сол күйдің эмиссия ықтималдығының таралуына сәйкес таңбаларды шығарады, таңбалардың бақыланатын тізбегін жасайды. 1-суретте гетерогенді ДНҚ тізбегі үшін қарапайым HMM көрсетілген [10].

1-сурет Қарапайым жасырын Марков үлгісі. Черчилль жұмысынан кейін гетерогенді негіз құрамы бар ДНҚ тізбегін сипаттайтын екі күйлі HMM көрсетілген [10]. (a) 1-күй (жоғарғы сол) AT-қа бай ретті, ал 2-күй (жоғарғы оң жақта) CG-ға бай ретті жасайды. Күй ауысулары және олармен байланысты ықтималдықтар көрсеткілермен көрсетіледі, ал әрбір күй үшін A,C,G және T үшін таңбаның эмиссия ықтималдықтары күйлердің астында көрсетілген. (Түсінікті болу үшін соңғы ұзындықтағы үлгі тізбегіне қажетті бастапқы және соңғы күйлер және байланысты күй ауысулары алынып тасталды.) (b) Бұл модель Марков тізбегі ретінде күй тізбегін жасайды және әрбір күй өзінің эмиссия ықтималдығына сәйкес таңбаны жасайды. бөлу (c). Тізбектің ықтималдығы күй ауысулары мен символдық эмиссиялардың көбейтіндісі болып табылады. Берілген бақыланатын ДНҚ тізбегі үшін біз оны «генерациялаған» жасырын күй тізбегін, яғни бұл позиция CG-ге бай сегментте немесе AT-ға бай сегментте екенін анықтауға мүдделіміз.

Неліктен олар жасырын Марков үлгілері деп аталады? Күйлердің тізбегі Марков тізбегі болып табылады, өйткені келесі алып жатқан күйді таңдау қазіргі күйдің сәйкестігіне байланысты. Дегенмен, бұл күй тізбегі байқалмайды: ол жасырын. Осы жасырын күйлер тудыратын таңбалар тізбегі ғана байқалады. Ең ықтимал күй тізбегі HMM-тің бақыланатын реттілікке туралануынан шығарылуы керек.

Жалпы, HMM пайдалану кезінде біз үш мәселенің біреуін шешуге мүдделіміз [13]. Біріншіден, бар HMM және бақыланатын тізбекті ескере отырып, біз HMM реттілігін (балл мәселесі) жасай алу ықтималдығын білгіміз келеді. Екіншіден, біз HMM реттілікті генерациялау үшін пайдаланатын оңтайлы күй тізбегін білгіміз келеді (теңестіру мәселесі). Үшіншіден, деректердің үлкен көлемін ескере отырып, біз деректерді (жаттығу мәселесі) ең жақсы есептейтін HMM құрылымы мен параметрлерін тапқымыз келеді. Хаусслер мен оның әріптестерінің түсінігі профильдерді HMM ретінде қайта жазуға болатынын және бұл мәселелер профильдермен қатарларды баллдау, оңтайлы реттілік профилін теңестіруді табу және түзетілмеген, сондай-ақ тураланған ақуыз немесе ДНҚ профильдерін құру мәселелеріне дәл ұқсас екенін көрсетті. реттілік деректері.

HMM негізіндегі профильдің мысалы 2-суретте көрсетілген. Бірнеше ретті туралау бағандарының көпшілігі «сәйкестік» күйлеріне тағайындалған. Сәйкестік күйлерінің әрқайсысында осы позицияда берілген қалдықты көру ықтималдығын көрсететін эмиссияның таралуы бар. Әрбір матч күйі басқа екі штатпен бірге жүреді. «Жою» күйі ештеңе шығармайды, бұл консенсусқа қатысты жою болып табылатын бағанды ​​өткізіп жіберуге мүмкіндік береді. "Кірістіру" күйі сәйкестік күйлерінің әрбір жұбы арасында бар және оның өзіне күй ауысуы бар. Бұл консенсусқа қатысты кез келген нүктеге бір немесе бірнеше таңбаны енгізуге мүмкіндік береді.

2-сурет HMM негізіндегі профиль. Krogh және т.б. енгізген үлгі бойынша үш позицияның HMM негізіндегі профилінің мысалы көрсетілген. [7oo]. Бірнеше ретті туралаудың әрбір маңызды бағаны (жоғарғы) күйлердің үштігі арқылы модельденеді: сәйкестік (M), кірістіру (I) және жою (D). Туралаудың әрбір модельденген бағанында 49 параметр бар: тоғыз күйдің ауысу ықтималдығы (көрсеткілер), 20 сәйкестік күй символының эмиссия ықтималдығы (жақшаға алынған амин қышқылы қалдықтарына [бір әріптік код] сәйкес келеді) және 20 кірістіру күйінің таңбаның эмиссия ықтималдығы ( әдетте туралаудан үйренбейді, бірақ оның орнына кейбір фондық үлестірімде бекітілген). Бұл мысалда түсінікті болу үшін барлық кірістіру таңбасының шығарылымдары 0,05 мәніне тең етіп көрсетілген, бұл кірістірулер негізінен «кездейсоқ» қалдық тізбегін жасайтын нүктенің астын сызады. Күйдің ауысу ықтималдылығы әдетте кірістірулер мен жоюларды (үзік көрсеткілер) қамтитын сирек жолдардың үстіне сәйкестік күйлері (қалың көрсеткілер) арқылы «негізгі сызықты» таңдауға бейім болады.

HMM формализмі екі үлкен үлес қосады. Біріншіден, HMM-ді тураланбаған, сондай-ақ тураланған деректерден үйретуге болады, ал стандартты профильдер бұрыннан бар бірнеше теңестіруді қажет етеді. Екіншіден, HMM негізіндегі профильдер кірістірулер мен жоюлардың негізделген статистикалық өңдеуін пайдаланады. Стандартты профильдерде енгізу/жоюдың оңтайлы ұпайларын тек сынақ пен қателіктен басқа анықтау мүмкін емес, ал туралаудың статистикалық маңыздылығын эмпирикалық әдістермен бағалау қажет. Енгізулер мен жоюларды өңдеу өте алшақтықты ақуыз тізбегін танудағы негізгі мәселе болғандықтан, профильдерді HMM ретінде қайта өңдеу қашықтағы құрылымдық гомологтарды тану үшін профильдердің қуаттылығын айтарлықтай арттыруды уәде етеді.

HMM және профильдер туралы болжамдар

HMM негізіндегі профильдер екі маңызды болжам жасайды. Біріншіден, қалдықтар арасындағы жұптық (немесе жоғары ретті) корреляциялар еленбейді. HMM - негізгі құрылым үлгісі. Бұл HMM міндетті түрде тек реттілік үлгілері болып табылады дегенді білдірмейді: позицияның 3D құрылымдық ортасын есепке алуға болады. Мысалы, қалдық ұпайлары позицияның құрылымдық ортасымен анықталатын және реттілікке еш қатысы жоқ 3D профильдері [5], HMM ретінде пайдалы түрде іске асырылуы мүмкін. Сол сияқты, «мұздатылған жуықтау» [14] деп аталатын (динамикалық бағдарламалау алгоритмдерін туралау және бағалау үшін пайдалануға болатындай) пайдаланатын ақуыздың «кері бүктелу» әдістерінің көпшілігін HMM әдістері ретінде пайдалы түрде көрсетуге болады. Екіншіден, HMM тізбектер үлгіден тәуелсіз жасалады деп болжайды. Нағыз биотізбектер жалпы эволюциялық шығу тегімен байланысты және өте тәуелсіз. Бұл кез келген профильдік әдіспен ең маңызды мәселе болуы мүмкін. Менің әріптестерім және мен [9] эволюциялық ағаштар тудыратын объективті дәйекті сынамаларды өтейтін максималды ықтималдықты HMM оқыту әдістеріне баламаларды сипаттадық, бірақ бұл әдістер жанама болып табылады және мәні бойынша жаңа HMM стиліндегі дәйектілікті өлшеу әдістеріне жатады. Митчисон мен Дурбин [15] жасырын Марков үлгілерімен максималды ықтималдық филогенезін қайта құрудың экскурсиялық біріктіруін зерттеді, бірақ қолданылған алгоритмдер әлі есептеуде практикалық емес.

HMM негізіндегі бірнеше ретті туралау

Профильдерден айырмашылығы, HMM-терді процесте бірнеше реттік келтіруді жасайтын, реттелмеген мысалдар тізбегі жинағынан оқытуға болады. Сөйлеуді тану өрісі Баум-Вельч алгоритмі деп аталатын жақсы зерттелген оқыту алгоритмін қамтамасыз етеді, оны Krogh et al. [7oo] жұмысқа орналасқан. Baldi және т.б. [8] [16] бірдей тиімді болып көрінетін градиентті түсіруді қолданатын балама HMM оқыту алгоритмін пайдалануды сипаттады. Екі тәсіл де жаһандық оңтайлыларды емес, жергілікті оңтайлы теңестіруді табады және олар кейде дұрыс емес оптимумдарда тұрып қалады. Крог және т.б. [7] жергілікті оптималдылықты болдырмау үшін «шуды енгізу» эвристикасын пайдаланды. Мен жергілікті оптимаға одан да аз бейім Крог тәсілінің имитациялық жасыту нұсқасын сипаттадым [17]. Бұл және соған байланысты жұмыс HMM әдістерін олардың ықтималдылығына қарай оңтайлы емес реттілік туралауларын таңдау үшін қолдануға болатынын көрсетті [18] [19].

HMM негізіндегі көп реттік теңестіру бұрынғы көптеген туралау әдістерінен қызық ерекшеленеді. Бағалау параметрлері, сондай-ақ туралау бастапқыда белгісіз. Демек, теңестіру баллдық параметрлер үшін күрделі априори таңдауды қажет етпейді. Сондай-ақ, HMM тәсілі есептелмейтін көптен көпке бірнеше ретті теңестіру мәселесін оны көптен бірге ретті HMM теңестіру мәселесі ретінде қайта шығару арқылы болдырмайды. Шынында да, бірізділіктерді ортақ консенсус үлгісіне теңестіру бірінші кезекте көп реттік көрсетуді қалайтынымызға интуитивті түрде әлдеқайда жақын. Ағымдағы HMM әдістері қолданыстағы тәсілдердің дәлдігіне жақындап келеді және көптеген бос орындар мен кірістірулерді қамтитын күрделі жағдайларда басқа бірнеше теңестіру алгоритмдерінен жиі асып түседі [17].

HMM негізіндегі ақуыз гомологын тану

Krogh және басқалар алғашқы HMM негізіндегі профильдер протеин гомологын тану үшін стандартты профильдерден сәл жоғары екенін көрсетті [7]. Тим Хаббард және оның әріптестері 1994 жылы ақуыз құрылымын болжау конкурсында HMM әдістерін қайталама құрылымды болжау құралдарымен үйлестіре қолданды. Хаббардтың болжамдары протеиннің кері бүктелуіне арналған әлдеқайда күрделі ағынды алгоритмдермен жасалған болжамдар сияқты дәл болды [19]. Хаббардтың HMM құрылғылары тек реттілік туралауларына негізделген. HMM құрылғылары реттілік пен құрылымдық орта ақпаратын біркелкі біріктіру үшін өте қолайлы болғандықтан, кері бүктеу және бұру өрістеріне HMM негізіндегі қосымша кірулер күтілуі мүмкін.

Алғашқы HMM негізіндегі профиль әдістерінің кемшілігі гомологты жақсы тану үшін олардың көп реттілік санын (> 100) қажет ететіндігі болды. Қазіргі уақытта «қоспа Дирихле» предпристерін [20] [21] немесе Dayhoff PAM (қабылданған мутация пайызы) алмастыру матрицаларын [22] пайдалана отырып, аминқышқылдарын алмастыру ықтималдықтары туралы алдын ала ақпаратты HMM-ге енгізуде айтарлықтай жетістіктерге қол жеткізілді. Гомологты тану үшін тиімді HMM енді бірнеше реттіліктен құрастырылуы мүмкін.

Жұптық ұқсастықты іздеу алгоритмдері (BLAST және FASTA) салыстырмалы түрде ұйымдастырылмаған дерекқорларда тиімді. Керісінше, HMM бір реттіліктердің орнына тураланған реттілік отбасыларына негізделгендіктен, HMM негізіндегі профильдерді кең ауқымды геномға немесе дерекқорды талдауға қолдану ақуыз тұқымдарының иерархиялық екінші буын дерекқорларын және дәйектілікті теңестіруді талап етеді. Иерархиялық түрде ұйымдастырылған SCOP (белоктардың құрылымдық жіктелуі) дерекқорын [23] өндірушілерімен бірлесіп, Эрик Соннхаммер домен реттілігін теңестіру және жасырын Марков үлгілері (E Sonnhammer, SR Eddy, жарияланбаған деректер) дерекқорын жасады. Бұл теңестіру дерекқоры қазіргі уақытта 100 түрлі протеиндік домен тобын модельдейді және Дүниежүзілік Интернетте (http://www.sanger.ac.uk/Pfam) қол жетімді. Протеин домендері мен ДНҚ қайталанатын отбасылардың HMM негізіндегі талдауы нематодтардың, ашытқылардың және адам ДНҚ-сын секвенирлеудің BLAST талдауын Сент-Луистегі Вашингтон университетіндегі геномдық орталықтардағы (АҚШ) және Кембридждегі (Ұлыбритания) Сэнджер орталығындағы әрекеттерді толықтыра бастады.

Жасырын Марков үлгісіне негізделген профильдер стандартты профильді талдаумен байланысты көптеген мәселелерді шешті. HMMs кірістірулер мен жоюларды бағалаудың дәйекті теориясын және құрылымдық және реттілік ақпаратын біріктіру үшін дәйекті негізді қамтамасыз етеді. HMM негізіндегі бірнеше ретті теңестіру жылдам жақсаруда. HMM негізіндегі гомологты тану HMM әдістері үшін протеинді кері бүктеуге арналған әлдеқайда күрделі ағынды әдістермен жақсы салыстыру үшін жеткілікті күшті. Кез келген дерлік UNIX платформасында жұмыс істейтін HMM негізіндегі профильдерге арналған бағдарламалық құралды http://www.cse.ucsc.edu/research/compbio/sam.html немесе http://genome.wustl.edu/eddy сайтынан тегін алуға болады. /hmmer.html.

HMM негізіндегі профильдер HMM тәсілдерінің ерекше жағдайы екенін есте ұстаған жөн. HMM әдістері генді болжау [24], ақуыздың қайталама құрылымын болжау [25] және тіпті радиациялық гибридтік карталарды құру [26] сияқты әртүрлі биологиялық мәселелерде қолданылуда.

HMM қолдануда біз қабылдайтын философия күрделі құрылымды-дәйектілік талдау мәселелері толық ықтималдық үлгілерін пайдалана отырып, статистикалық қорытынды есептер ретінде ең жақсы шешіледі. Зерттеудің барған сайын белсенді өрісі - бұл HMM-лер шеше алатынға қарағанда күрделірек басқа толық ықтималдық тәсілдерін әзірлеу, мысалы, стохастикалық контекстсіз грамматиканы пайдалана отырып, РНҚ қайталама құрылымын талдау [27] [28] немесе ақуыз тізбегіндегі жұптық корреляциямен айналысу ( яғни жіпті тігу әдістері және олардың туыстары) Марковтың кездейсоқ өрістерін қолдану арқылы [29] [30]. Осы және басқа да толық ықтималдық модельдер туралы Хомскийдің есептеуіш лингвистика мәселелері үшін енгізген формальды грамматикалардың Хомский иерархиясы шеңберінде ойлану пайдалы [31]. Searls [32] биореттік талдауда лингвистикалық тәсілдерді қолдануға тамаша кіріспе жазды.

Екі жылдың ішінде HMM негізіндегі профильдер таза теориядан протеин құрылымын болжауда және кең ауқымды геном тізбегін талдауда практикалық қолдануға көшті. HMM теориясының биттері, мысалы, Дирихле априарларының қоспасын қолдану басқа талдау әдістеріне енгізілуде [33]. HMM және толық ықтималдық тәсілдерінің адал партизаны ретінде, мен құрылымдық биологиядағы HMM қолданбаларының пайдалылығы мен ауқымы тек өсе береді деп ойлаймын.

Мен Кембридждегі (Ұлыбритания) есептеу биологиясын талқылау тобындағы әріптестеріме, әсіресе Грейм Митчисон мен Ричард Дурбинге көптеген идеялары үшін алғыс айтамын. Менің HMMs бойынша жұмысыма Human Frontier Science Program (LT-130/92) және Ұлттық денсаулық институттары (1-F32-GM16932) ұсынған постдокторлық стипендиялар ілтипатпен қолдау көрсетті және қазіргі уақытта Вашингтон университеті қолдау көрсетеді.

Сілтемелер және ұсынылатын оқу

1. Альтшул С.Ф., Богуски М.С., Гиш В, Вутон Д.К.:
Молекулярлық реттілік деректер қорын іздеу мәселелері.
Nat Genet 1994, 6: 119 129.

2. Бартон Дж.
Протеиннің бірнеше реттілігін теңестіру және икемді үлгіні сәйкестендіру.
Әдістер Enzymol 1990, 183: 403 427.

3. Грибсков М, Маклахлан А.Д., Эйзенберг Д:
Профильді талдау: алыс туыстас белоктарды анықтау.
Proc Natl Acad Sci USA 1987, 84: 4355 4358.

4. Тейлор В.Р.:
Консенсус үлгісін теңестіру арқылы ақуыз тізбегі гомологиясын анықтау.
Дж Мол Биол 1986, 188: 233 258.

5. Боуи Ю, Люти Р, Эйзенберг Д:
Белгілі үш өлшемді құрылымға қатпарланатын ақуыз тізбегін анықтау әдісі.
Ғылым 1991, 253: 164 170.

6. Люти Р, Боуи Ю, Эйзенберг Д:
Үш өлшемді профильдері бар ақуыз модельдерін бағалау.
Табиғат 1992, 356: 83 85.

7. Krogh A , Brown B , Mian IS , Sjolander K , Haussler D :
Есептеу биологиясындағы жасырын Марковтың модельдері: ақуызды модельдеуге қосымшалар.
Дж Мол Биол 1994, 235: 1501 1531.
Бұл протеин мен ДНҚ тізбегі профильдері үшін HMM әдістерін қолдануды енгізген қағаз.

8. Baldi P, Chauvin Y, Hunkapiller T, McClure MA:
Биологиялық бірінші реттілік туралы ақпараттың жасырын Марков модельдері.
Proc Natl Acad Sci USA 1994, 91: 1059 1063.

9. Эдди СР, Митчисон Дж, Дурбин Р:
Максималды дискриминация жасырын Марков үлгілерінің бірізділік консенсусы.
J Comput Biol 1995, 2: 9 23.
Бұл құжат ретті салмақтау әдістерінің үнемі өсіп келе жатқан санына HMM стиліндегі принципті үлес болып табылады. Ол біржақты реттілік көрсетілімін өтейтін максималды ықтималдық параметрін бағалауға балама ұсынады.

10. Черчилль Г.А.:
Гетерогенді ДНҚ тізбегі үшін стохастикалық модельдер.
Bull Math Biol 1989, 51: 79 94.

11. Stultz CM , White БК , Smith TF :
Күй-ғарыштық модельдеуге негізделген құрылымдық талдау.
Protein Sci 1993, 2: 305 314.

12. White БК , Stultz CM , Smith TF :
Стохастикалық модельдеу және аминқышқылды тізбектерді оңтайлы фильтрлеу арқылы белоктардың жіктелуі.
Math Biosci 1994, 119: 35 75.

13. Рабинер Л.Р.:
Жасырын Марков үлгілері және сөйлеуді танудағы таңдалған қолданбалар бойынша оқулық.
Proc IEEE 1989, 77: 257 286.

14. Годзик А, Колински А, Скольник Дж:
Кері ақуызды бүктеу мәселесіне топология саусақ ізі тәсілі.
Дж Мол Биол 1992, 227: 227 238.

15. Митчисон Дж.Дж., Дурбин Р.М.:
Ағашқа негізделген максималды ықтималдық ықтималдылығын алмастыру матрицалары және жасырын Марков үлгілері.
J Mol Evol 1995, 41: 1139 1151.

16. Балди П, Шовин Ю:
Жасырын Марков үлгілері үшін бірқалыпты онлайн оқыту алгоритмдері.
Нейрондық есептеу 1994, 6: 305 316.

17. Eddy SR :
Жасырын Марков үлгілерін пайдалана отырып, көп реттік туралау.
Молекулалық биологияның интеллектуалды жүйелері бойынша Үшінші халықаралық конференция материалдарында. Ролингс C, Clark D, Altman R, Hunter L, Lengauer T, Wodak S. Menlo Park өңдеген: AAAI Press, 1995, 114 120.

18. Эллисон Л, Уоллес CS:
Тегістеу ықтималдығының кейінгі таралуы және оны эволюциялық ағаштардың параметрлерін бағалауға және бірнеше теңестіруді оңтайландыруға қолдану.
J Mol Evol 1994, 39: 418 430.
Авторлардың жұмысы HMM-ish сипатында, бірақ ықтималдық модельдеу (максималды ықтималдық) емес, ақпарат теориясы тілінде (хабарламаның ең аз ұзындығы) жазылған. Контраст сабақ береді.

19. Shortle D :
Протеин қатпарын тану.
Nat Struct Biol 1995, 2: 91 93.
Бұл ақуыз құрылымын болжаудың қазіргі әдістері қатаң салыстырылған Асиломар конференциясының қысқаша шолуы. Есіңізде болсын, Шортл протеин құрылымындағы жұптық қалдық корреляциямен айналысатын ағынды тігу әдістерін HMM-мен шатастырады, оларда емес.

20. Браун М , Хьюи Р , Крог А , Миан ИС , Сжоландер К , Хаусслер Д :
Дирихлет қоспасын пайдалану протеин тұқымдастары үшін жасырын Марков үлгілерін алу үшін.
Молекулалық биологияның интеллектуалды жүйелері бойынша бірінші халықаралық конференция материалдары. Хантер Л, Searls D, Shavlik J. Menlo Park өңдеген. AAAI Press, 1993, 47 55.

21. Карплус К:
Амин қышқылдарының таралуын бағалау үшін регуляризаторларды бағалау.
Молекулалық биологиядағы интеллектуалды жүйелер бойынша Үшінші халықаралық конференция материалдары Ролингс C, Clark D, Altman R, Hunter L, Lengauer T, Wodak S. Menlo Park өңдеген. AAAI баспасөзі, 1995, 188-196.

22. Балди П :
Ауыстыру матрицалары және жасырын Марков модельдері.
J Comput Biol 1995, 2: 487 491.

23. Мурзин А, Бреннер С.Е., Хаббард Т, Чотия С:
SCOP: тізбектер мен құрылымдарды зерттеуге арналған белоктар дерекқорының құрылымдық жіктелуі.
Дж Мол Биол 1995, 247: 536 540.

24. Крог А , Миан ИС , Хаусслер Д :
E. coli ДНҚ-да гендерді табатын жасырын Марков моделі.
Nuclein Acids Res 1994, 22: 4768 4778.
Бұл әртүрлі ақпарат түрлерін бір ықтималдық үлгісіне біріктіру үшін HMM әдістерінің күші туралы жақсы сурет. Крогтың гендік моделі рибосомаларды байланыстыру орындарының статистикалық сипаттамасын, іске қосу және тоқтату кодондарын, кодонды пайдалануды және генаралық қайталанатын элементтерді қамтиды.

25. Асай К , Хаямизу С , Ханда КИ :
Жасырын Марков моделі бойынша ақуыздың екіншілік құрылымын болжау.
Comput Appl Biosci 1993, 9: 141 146.

26. Lange K , Boehnke M , Cox DR , Lunetta KI :
Полиплоидты радиациялық гибридті картаға түсірудің статистикалық әдістері.
Genome Res 1995, 5: 136 150.

27. Эдди СР , Дурбин Р :
Коварианттық модельдер арқылы РНҚ реттілігін талдау.
Nuclein Acids Res 1994, 22: 2079 2088.

28. Хаусслер Д , Сакакибара Ю , Браун М :
tRNA модельдеуге арналған стохастикалық контекстсіз грамматикалар.
Nuclein Acids Res 1994, 22: 5112 5120.

29. Бергер Б , Уилсон ДБ , Вольф Е , Тончев Т , Милла М , Ким П.С.:
Жұптық қалдық корреляцияны қолдану арқылы орамды орамдарды болжау.
Proc Natl Acad Sci USA 1995, 92: 8259 8263.
Ақуыздар тізбегі мен құрылымын талдауда жұптық қалдық корреляциясын есепке алудың маңыздылығы даулы. Егер жұптық корреляция салыстырмалы түрде маңызды емес болса, HMMs есептеу құнының бір бөлігі үшін ақуызды кері бүктеуге арналған күрделірек «жіптеу» әдістері сияқты жақсы болуы мүмкін. Бүгінгі күнге дейін бұл қағаз жұптық қалдық корреляциясын модельдеудің маңыздылығы туралы мен сенімді деп санайтын бірнеше дәлелдердің бірі болып табылады. Бергер және басқалардың көзқарасы қарапайым Марковтың кездейсоқ өрісі болып табылады, бірақ олар оны қағазда анық атамайды.

30. White БК , Мучник I , Смит Т.Ф.
Modeling protein cores with Markov random fields.
Math Biosci 1994, 124: 149 179.

31. Chomsky N :
Three models for the description of language.
IRE Transactions in Information Theory 1956, 2:

32. Searls DB :
The linguistics of DNA.
Am Sci 1992, 80: 579 591.

33. Tatusov RL , Altschul SF , Koonin EV :
Detection of conserved segments in proteins: Iterative scanning of sequence databases with alignment blocks.
Proc Natl Acad Sci USA 1994, 91: 12091 12095.


Application on Biological sequences

Let’s consider a set of functionally related DNA sequences. Our objective is to characterise them as a “family”, and consequently identify other sequences that might belong to the same family.

We start by creating a multiple sequence alignment to highlight conserved positions:

It is possible to express this set of sequences as a regular expression. The family pattern for this set of sequences is:

Each position in the regular expression represents the nucleotides in the chain. Multiple options for each position are gathered in a bracket: thus, the first element could equally be an A or a T, the second one a C or G, and so on. The element indicated with a * represents a gap area: only the A is not bracketed, because it is the only possible option of that position.

The regular expression is useful because it allows us to spot the pattern of this family of sequences in a visual and simple compact view. However, the regular expression is not an adequate method when establishing whether other sequences are part of this family.

As an example, let’s consider two new sequences 1 and 2:

Both sequences fit the regular expression given above and, based on that alone, they could be considered part of the family. However, we can see that the first sequence is formed by the nucleotides occurring the fewest times in the multiple sequence alignment, while the second is formed by those most common. Indeed, in the first position, the T is present only once in the multiple sequence alignment, while A in all other sequences, similarly for the in the second position, the G only once and C, for all remaining sequences.

We need a way to measure the “distance” between a new sequence and the original set of family sequences. To solve this problem, we can use the MC and HMM:


LESSON PLAN

The class session takes place in a room with one large table, or tables suitable for sub-groups. Lecture slides are projected on the board. Students have access to computers (laptops).

Students in Bio 4342 are required to read 'What is a hidden Markov model?' by Sean Eddy (3) prior to class. The paper is relatively short and is well-designed for non-CS readers.

The lesson plan is presented as a flowchart (Figure 2). Class starts with a brief introductory lecture followed by discussions and collaborative work.


2-сурет. Timeline for Introduction to Hidden Markov Models Class Activities.

The lecture on HMM fundamentals is aimed at giving students a basic intuition for how ab initio gene finders identify genes within a genomic sequence. The lecturer introduces the types of problems that an HMM is designed to solve, as well as the different components of an HMM, including transition probabilities, emission probabilities, and state machines.

There are various ways to make students confortable with the probabilistic nature of the HMM. We include two Power Point presentations that were used as the HMM introductory lecture at Washington University. Both presentations were designed for students with similar background knowledge. One of the presentations (by Zane Goodwin) focuses primarily on the material from the Eddy paper (S1, S3). Because the students were assigned to read the Eddy paper before class, the instructor can assume that the students are already familiar with the HMM 'toy' model diagram. This pre-reading enables the instructor to spend more time on explaining how different elements of the system work. This approach also teaches students to be more confident when reading conceptual scientific publications. The second presentation (by Zongtai Qi) provides broader background information on HMMs, using weather prediction (a common choice) to introduce the concepts of hidden states and state transition probabilities before turning to the splice site prediction model. This presentation also provides a detailed explanation of the components in the 'toy' HMM model and the probability calculations for each state path (S4).

A critical aspect of the introduction is developing an understanding of how the state path probabilities are calculated. Dr. Weisstein uses a six nucleotide-long DNA sequence as an example to illustrate the states, transition and emission probabilities, and the probability associated with each state path in order to identify the most probable state path. All calculations are done manually on the board with active student participation (lecture video recording is available at Genomics Education Partnership website http://gep.wustl.edu/media/weisstein-hmm-lecture). The close interactions between the instructor and students help ensure the success of each student when they are 'playing' with the simple HMM example subsequently using the Excel workbook (S6, S10).

Students are then introduced to the Excel workbook. For ease of demonstration, the workbook begins by analyzing a very short sequence before re-creating Eddy's full, 26-bp model. The first sheet in the workbook, appropriately named "Simple Model," demonstrates the calculations involved in using the parameters of the HMM to determine the most likely splice site location (Figure 3). The user enters a short DNA sequence and sets the model parameters in the Excel worksheet, which uses these values to compute the likelihood of each potential 5' splice site location. The workbook and step-by-step instructions are provided in the S5. Based on the reflections from the Bio 4342 students at Washington University in St. Louis, we suggest that the instructor starts this activity with the Excel spreadsheet projected on the board and walk through the first worksheet, perhaps stopping at cells that are most crucial to creating the predictions. It would also be beneficial to make students aware that the homework contains questions that are based on the Excel workbook activity.


3-сурет. The Excel workbook “Hidden Markov Model” illustrates the mathematical workings of an HMM, using Eddy’s (2004) example of locating the 5’ splice site within a DNA sequence.

After completing the exercises associated with the "Simple Model" as a group, students move to the "Full Model" sheet, which uses the exact sequence and parameters as the Eddy publication (3) at this point students are expected to be working mostly individually.


Hidden Markov Model - Biology

Markov Models are conceptually not difficult to understand, but because they are heavily based on a statistical approach, it's hard to separate them from the underlying math. This page is an attempt to simplify Markov Models and Hidden Markov Models , without using any mathematical formulas.

Brief overview of a Model

A Markov Model , in the context of Molecular Genetics is nothing more than a series of probabilities which tell you how likely a particular sequence is to have descended from a particular "Ancestral" sequence, or vice versa, what the most probable "Ancestral" sequence is. Tada. Now you know what a Markov Model is. However, that takes most of the elegance of the process and puts it out of it's misery. The beauty of the model is that, among many other things, it can create it's own "Ancestral" sequence and set of rules.

A Markov Model (MM) can be thought of as a board game, albeit not a particularly fun board game and certainly not one I'd pull out on a lazy sunday evening, but a board game of sorts. Somewhat like a cross between snakes and ladders (since the squares are often connected to non adjacent squares) and a really weird version or trivial pursuit, where each square you land on gives you an answer instead of asking a question. However, very much different from either of those games, usually the best strategy is to stay on the same square for long periods of time.

The rules of the Markov Model Game:

1. Each square will give you a letter. (In the case of DNA, you only have a 4 letter alphabet to work with, ACTG. For proteins, with a 20 letter alphabet, you have a slightly more complex model to deal with.) Each square will give out the letters in different proportions. (Some squares will give As and C's most of the time, or some will just give out G's all the time.. but, most importantly, no two squares are the same.)
1a. Each letter has a number (or score) between 1 and 0 attached to it.
1б. At the end of the game, you multiply all of those numbers together to obtain your final score. (It's hard to keep ALL the math out of it)

2. The longer you stay on one square, the better your model is. Hence
2а. Each time you move from one square to another, you are penalized.

3. There are two squares which you can go to at any time, the delete square and the insert square, with little or no penalty attached, however they do not give you a letter and thus, no number is generated either.

The goal of the Markov Model Game.

The object of the Markov Model Game is to take any given sequence and find how likely it is to have come from your "Ancestral" sequence, that is, to obtain the highest possible score, while raking up the fewest possible penalties. Alternately, you can use a single sequence, and determine how well it fits your model. And that is exactly what we'll try to do with an example.

A really simple version of the game would have two squares, and would start with the sequence:

The two squares in this game would be:

In Square 1, you get A's and T's nearly all of the time, but you can get the Rare C or G.

In Square 2, you get C's and G's nearly all of the time, but you can get the Rare A or T.

given this example, you can tell that the best strategy for playing this round would be to stay on the first square until you've reached the 15th letter, then move over to the 2nd square. As far as the first C in the sequence (11th letter) is concerned, moving to square 2 and then back would have incurred an additional 2 moving penalties (call that strategy A), whereas staying on Square 1 and accepting a low score for that letter (strategy B) is much more likely to help you win the round.

Here's where the game becomes REALLY weird. Hidden Markov Models (HMMs) can be hidden to different degrees (1) depending on what you aren't allowed to see. A true Hidden Markov Model arises when you aren't allowed to know what squares a player took to win the game. however, you are allowed to know the sequence of letters that were emitted as they won the game. Yet, the path that the player took to get those letters can't be seen. This is really starting to stretch the model, but that would essentially be like playing the board game in the dark, while the board moves around. ok.. that's really not getting anywhere. Perhaps it's more like having someone else play the game for you, but won't tell you what square they're putting the game piece on. but you get the point. That may sound rather odd.. after all why would you want someone else to play a game for you, especially when they won't tell you what's going on?

Well, if we know what the board looks like, but not the path, we can use the theory of a Hidden Markov Model to: (2)

Problem #1: Given an observed set of letters, what's the best possible score you can obtain?
Problem #2: Given an observed set of letters, what's the best possible path you can travel?
Problem #3: How can we create a better board to play a specific game?

Unfortunately, like any board game.. how can you improve on a best seller? In fact, there is no known method to solve problem #3 mathematically, although small modifications can be found, there is no way to ever find the best possible game for any particular round. As far as I can tell, this isn't impossible, it's just that no one knows how to do it. There is always room to improve.

Regardless of what we don't know or what we want to find out, there are always some common elements to a Hidden Markov Model . We might not know all or any of them, but they the pieces that are included with the HMM game.

1. In order to do anything productive, you must know the number of squares
2. You also need to know the size of the alphabet your game uses. (DNA uses 4, Proteins use 20 or so..)
3. There is also a probability of moving from one square to the next on any given move.. consider these the dice of the game.
4. As well, there is a probability of any given square emitting a particular. a second set of dice.
5. And, last but not least, you need to know how everything starts. This is rather like monopoly, where the rule sheets tell you how much money each player gets. Although, for this game, you just need to know which square says GO.

Various types of Hidden Markov Models

An interesting consequence of Markov Models comes from the fact that you can design different boards to play on. From any one square, you don't necessarily have to be able to get to any other square and you can make paths between any two squares one directional. Imagine a four square model, where the squares are places in a box shape (yes, I do mean a square, but I don't want to make it any more confusing than it already is), and you can go from any square to any other square.

1 2
3 4

First imagine a game where you can move from any square to any other square.. this is the most "complex" case, despite being easiest to explain.

Now, to create a second game, use the same configuration, but this time you can't move diagonally.

A third game would have you start on square 1 and only move to numbers that are greater than the number that you're on. (for example.. in the order 1, 3, 4.) Obviously you'd have to stop on square 4.

A fourth game would have you only move clockwise on the squares.. 1, 2, 3, 4, 1, 2, 3. etc.

By now, you get the idea. There are an incredible number of games you can create with only 4 squares. And, naturally, you can increase the number of squares, thus increasing the number of games even further.

At any rate, you now have an endless number of games you can play on a lazy sunday afternoon. as I said before, Markov Models wouldn't be my choice of games. I'd prefer a good game of hearts or Silly Bridge or even Trivial Pursuit, but this should be good food for thought. Trivial pursuit has 73 squares, imagine how many Markov Models you could make out of that. Happy Gaming.

2. Rabiner, Lawrence R. A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition . Proceedings of the IEEE, vol. 77, No. 2, February 1989. P 257-286

Krough, et al. Hidden Markov Models in Computational Biology, Applications to Protein Modeling . Ж.Мол. Биол. (1994) 235, 1501-1531


Hidden Markov Model - Biology

MDPI жариялаған барлық мақалалар ашық қолжетімділік лицензиясы бойынша бүкіл әлем бойынша бірден қолжетімді болады. Суреттер мен кестелерді қоса, MDPI жариялаған мақаланың барлығын немесе бір бөлігін қайта пайдалану үшін арнайы рұқсат талап етілмейді. Ашық қолжетімді Creative Common CC BY лицензиясы бойынша жарияланған мақалалар үшін мақаланың кез келген бөлігін түпнұсқа мақалаға нақты сілтеме жасалған жағдайда рұқсатсыз қайта пайдалануға болады.

Көркем мақалалар осы салада жоғары әсер ету мүмкіндігі бар ең озық зерттеулерді білдіреді. Көркем мақалалар жеке шақыру немесе ғылыми редактордың ұсынысы бойынша жіберіледі және жарияланғанға дейін сараптамадан өтеді.

Көркем мақала түпнұсқа зерттеу мақаласы, жиі бірнеше әдістерді немесе тәсілдерді қамтитын маңызды жаңа ғылыми зерттеу немесе ғылымдағы ең қызықты жетістіктерді жүйелі түрде қарастыратын саладағы соңғы прогресс туралы қысқаша және нақты жаңартулары бар жан-жақты шолу мақаласы болуы мүмкін. әдебиет. Қағаздың бұл түрі зерттеудің болашақ бағыттары немесе ықтимал қосымшалар туралы болжамды береді.

Редактор таңдауы мақалалары дүние жүзіндегі MDPI журналдарының ғылыми редакторларының ұсыныстарына негізделген. Редакторлар журналда жақында жарияланған мақалалардың аздаған санын таңдайды, олар авторлар үшін әсіресе қызықты немесе осы салада маңызды болады деп есептейді. Мақсат - журналдың әртүрлі зерттеу салаларында жарияланған ең қызықты жұмыстардың кейбірінің суретін ұсыну.


Бейнені қараңыз: Құраққа мата неше см болады?! (Қаңтар 2022).