A molekuláris filogenetikai a használata szekvenciák a makromolekulák biológiai információt szerezni az evolúciós történetét az élő szervezetek , köztük a kapcsolatuk (a törzsfejlődés ). Fontos eszköz a molekuláris evolúció tanulmányozásához . A termék egy molekuláris filogenetikájának elemzés vagy egy filogenetikai fát vagy egy grafikon a filogenetikus hálózat .
A biológiai makromolekulák , például a DNS , az RNS vagy a fehérjék alapvetőek az összes élő komponens szempontjából. Ezek a molekulák az alapvető molekuláris építőelemek (a monomerek ) szekvenciájából álló polimerek , amelyek egymás utáni képezik az elsődleges szekvenciát. Így a DNS-t úgy lehet elképzelni, mint egy négybetűs ábécébe írt szöveget, a nukleotidokat : adenozin (A), timidin (T), guanozin (G) és citidin (C), a fehérjéket pedig abc-ba írt szövegként. 20 betű, a 20 aminosav .
Az élő szervezetek genomjai egymást követő mutációk révén fejlődnek, amelyek idővel a DNS-ben felhalmozódnak, többé-kevésbé állandó becsült sebességgel, tudván, hogy a nem kódoló DNS, amelyet a természetes szelekció nem befolyásol , az élőlények DNS-jének legnagyobb részét alkotja. Két élő organizmus rokonságának mértékét tükrözi tehát a DNS-ek és fehérjeik szekvenciáinak hasonlósága . A DNS-ben nagyon szoros rokonságban álló fajoknak nemrégiben közös ősük volt, mivel kevés mutációnak volt ideje előfordulni, mióta elrugaszkodott utolsó közös őstől .
Egészen a közelmúltig a biológiai molekulák elsődleges szekvenciája nem volt közvetlenül hozzáférhető. Az elmúlt 20 év során azonban a polimeráz láncreakció (PCR) és a DNS-szekvenálás Sanger- módszerrel lehetővé tette ennek a megközelítésnek nagyon fontos fejlődését, amelynek eredményeként radikálisan megváltoztatták az organizmusok osztályozásának hagyományos nézetét. . A molekuláris filogenetika a felmerült problémák ellenére lehetővé tette, hogy új életet leheljen a szisztematikába , lehetővé téve az organizmusok egyes morfológiai jellemzőinek eredetét.
Ezenkívül a molekuláris filogenetika társulhat olyan területekhez, mint az igazságügyi orvostan vagy a genetikai tesztelés .
Fontosnak tarthatjuk, hogy a tág értelemben vett molekuláris szisztematika 1904 körül született, amikor GHF Nuttall először a főemlősök közötti immunológiai inkompatibilitást alkalmazta relatív evolúciós távolságuk megbecsülésére. Egyre kifinomultabb módszereket alkalmaztak a fehérjék közötti különbségek tanulmányozására . Egyrészt immunológiai módszereket, például immundiffúziót alkalmaztak a főemlősök rokonsági kapcsolatainak vizsgálatára Allan Wilson által . Másrészt az allozimok és izoenzimek elektroforézise .
A molekuláris szisztematika elméleti kereteit az 1960-as években hozták létre Emile Zuckerkandl , Emanuel Margoliash , Linus Pauling és Walter M. Fitch munkájában . A molekuláris szisztematika alkalmazását Charles G. Sibley ( ornitológia ), Herbert C. Dessauer ( herpetológia ) és Morris Goodman ( főemlősök ) fejlesztette ki, majd Allan Wilson , Robert K. Selander és John C. Avise (különböző csoportokat tanulmányozva) ). A fehérje elektroforézissel 1956 körül kezdték el dolgozni. Bár az eredmények nem voltak kvantitatívak, és kezdetben nem javították a morfológiai besorolást, csábító nyomokat szolgáltattak, hogy például a madarak osztályozásának régóta fennálló fogalmai jelentős felülvizsgálatot igényelnek. Az 1974-1986 közötti időszakban a DNS-DNS hibridizáció volt a domináns technika.
Az első DNS-alapú vizsgálatok a Charles Sibley és Jon Ahlquist által kifejlesztett DNS-DNS hibridizációs módszert használták . Ez a technika lehetővé teszi két faj DNS-e közötti távolság felmérését a hibrid kettős szálú DNS disszociációs hőmérsékleteinek összehasonlításával, és némi sikerrel alkalmazták a madarak vagy a főemlősök rokonsági viszonyainak tanulmányozására. Ezek a módszerek azonban a globális távolságok kiértékelésén alapultak , az összehasonlított karakterek homológiájának értékelésének lehetősége nélkül , ami a kladisztikus módszer modern filogenetikai alapokon történő alkalmazásának elengedhetetlen feltétele . Ezt a problémát nagyrészt DNS-szekvenálással oldják meg ( Sanger- módszerrel ), amely közvetlen hozzáférést biztosít a molekulák primer szekvenciájához, ami a szoros értelemben vett molekuláris filogenetika alapja.
Az organizmusok DNS-ének minden régiója (és ezért az általuk kódolt fehérjék) nem azonos sebességgel fejlődnek; egyes gének "korlátozottak", mert az organizmusok túléléséhez nélkülözhetetlen funkciókat látnak el (e gének minimális mutációi is drasztikusan korlátozzák hordozóik életképességét). Ezzel szemben bizonyos régiók, például az immunrendszer markereit kódoló gének , gyorsan fejlődnek. Az ilyen típusú markerek tehát lehetővé teszik az evolúciós kapcsolatok kis mértékű tanulmányozását, például egy populáción belül vagy szorosan rokon fajok között (például a főemlősök Nuttall vagy Wilson munkájának példájával). Ez még inkább igaz a nem kódoló régiókra, amelyeken a szelekciós nyomás nem létezik.
A globális vizsgálatok elvégzéséhez olyan szekvenciákra vagy génekre kell támaszkodni, amelyek minden élő fajban jelen vannak, hogy kimerítő és szisztematikus elemzéseket lehessen végezni. Ezekről a génekről azt mondják, hogy "mindenütt jelen vannak". A legfontosabb és klasszikus a 16S és 23S ( prokarióta ) vagy 18S és 28S ( eukarióta ) riboszomális RNS markerek, amelyeket általában használnak. Ezek a strukturális RNS-ek a riboszómák fő alkotóelemei, amelyek felelősek az mRNS-ek fehérjékké történő átalakításáért , amelyek működése elengedhetetlen az élet számára, és amelyek ezért minden élő szervezetben jelen vannak.
A szekvenálás fejlődése lehetővé tette a molekuláris filogenetikai vizsgálatok elvégzéséhez rendelkezésre álló markerek számának növelését. Tehát a mitokondriális és kloroplaszt genomokat, amelyek több mint egy tucat gént tartalmaznak, alkalmaztak az állatok, illetve a növények kapcsolatainak tanulmányozására. Újabban a rendelkezésre álló genom vagy a teljes transzkriptóm adatok növekedése lehetővé tette az összes olyan gén tanulmányozását, amelyek homológiája ellenőrizhető. A száz gént tartalmazó adatsorokat ma már gyakran használják az eukarióták vagy állatok kapcsolatainak feloldására. Ezt az új megközelítést filogenomikának hívják .
Egy fa felépítése a molekuláris filogenetikában három szakaszon megy keresztül:
Az első két lépés fontossága ellenére a molekuláris filogenetika fejlődésének nagy része magukhoz a rekonstrukciós algoritmusokhoz kapcsolódik.
Adattípus | ||
---|---|---|
Újjáépítési módszer | Távolságok | Webhely (ek) |
Fürtözési algoritmus | UPGMA , szomszéd csatlakozik | |
Optimalizálási kritérium | Minimális evolúció (ME) | Maximális parsimony ( MP ) Maximális valószínűség ( ML ) |
A maximális parsimony módszerei, vagy egyszerűbben a parsimony, vagy akár Wagner parsimony módszerei, nem paraméteres statisztikai módszerek . Ezek a módszerek lehetővé teszik a hierarchikus osztályozási fák felépítését a gyökeresedés után, amelyek lehetővé teszik az információk megszerzését egy taxonhalmaz rokonsági szerkezetéről. A maximális parsimónia feltételezése szerint a „preferált” filogenetikai fa az, amelyhez a legkevesebb evolúciós változás szükséges.
A maximális parszimónia módszerei azonban pusztán koncepcionális szinten tűnnek alkalmatlannak a jelentős ideig tartó biológiai evolúcióhoz, ahol minden változást és megfordulást valószínűleg újra és újra feltártak. Ez az elv azt jelenti, hogy az evolúciós konvergencia és a reverzibilitás (a karakter visszatérése az ősállapotba) jelenségek viszonylag ritkák.
Az első lépés a fa jövőbeni levelei közötti távolság kritériumának megválasztása. Például, ha ezek a lapok DNS-szekvenciák, kettőjük távolságaként választhatjuk az eltérő nukleotidok számát. Ennek az értéknek a meghatározásához el kell végezni annak összehangolását. Ezután az UPGMA vagy a Szomszéd csatlakozás módszerét használhatjuk a fa levezetésére.
A valószínűségi módszerek között különösen a maximális valószínűség és a Bayes-i következtetés szerepel .
A legnagyobb valószínűségA maximális valószínűség becslés egy általános statisztikai módszer, amelyet egy adott minta valószínűség-eloszlásának paramétereinek megállapítására használnak. Ezt a módszert Ronald Aylmer Fisher statisztikus dolgozta ki 1922-ben.
Itt van egy tanítási példa: Vegyünk egy olyan esetet, amikor az 1-től n-ig számozott "n" jegyet egy dobozba helyezzük, és közülük többet ("k" jegyeket) véletlenszerűen választunk ki (egyenletes elosztás). Ha az "n" ismeretlen, akkor az n maximális valószínűség-becslő a jegyre írt "m" szám. Ha sok jegyet választottunk ki, akkor azt gondolhatjuk, hogy a valószínűségek eloszlása azt eredményezi, hogy a kapott maximális "m" szám közel van az "n" számhoz, ellenkező esetben, ha kevés jegyet választottunk, akkor feltételezhetjük, hogy az "m" A "maximum" a minta közepén van, tehát egy képlet: n = m + (m / k) - 1.
Bayesi következtetésA Bayes-i következtetés egy következtetési módszer, amely lehetővé teszi egy esemény valószínűségének levezetését az előzőleg ismert más események valószínűségéből. Főként Bayes tételén alapul. A bayesi érvelés azokra az esetekre vonatkozik, amikor egy állítás lehet igaz vagy hamis, bizonytalansági megfigyelések szerint. Ezekhez az eredményekhez valószínűségi eloszlást rendelünk.
A molekuláris szisztematika lényegében kladisztikus megközelítés: feltételezi, hogy a besorolásnak meg kell felelnie a filogenetikai származásnak, és hogy az összes érvényes taxonnak monofiletikusnak kell lennie.
Az organizmusok közötti kiterjedt horizontális géntranszfer közelmúltbeli felfedezése fontos bonyodalmat jelent a molekuláris szisztematikában, jelezve, hogy ugyanazon organizmuson belül különböző géneknek eltérő filogenikája lehet.
Ezenkívül a molekuláris filogenikák érzékenyek azokra a feltételezésekre és modellekre, amelyek beépülnek a konstrukciójukba. Olyan problémákkal szembesülnek, mint a hosszú elágazású vonzódás, a telítettség és a taxon mintavételi problémák. Ez azt jelenti, hogy nagyon különböző eredmények érhetők el, ha különböző modelleket alkalmaznak ugyanarra az adathalmazra.