A genom , vagy ritkán genom , egy faj összes genetikai anyaga , amelyet a dezoxiribonukleinsavban (DNS) kódolnak, kivéve bizonyos vírusokat, amelyek genomja ribonukleinsavból (RNS) áll. Különösen a fehérjéket kódoló vagy a strukturált RNS-eknek megfelelő összes gént tartalmazza. Ezért szétbomlik kódoló szekvenciákra (átírva messenger RNS-re és fehérjévé transzlálva ) és nem kódoló szekvenciákra ( nem átírva vagy átírva RNS-re, de nem transzlálva).
A genom egy vagy több kromoszómából áll , amelyek teljes száma a figyelembe vett fajtól függ, mindegyik kromoszóma egyetlen DNS-molekulából áll, lineáris az eukariótákban és leggyakrabban kör alakú a prokariótákban . Mindegyik kromoszóma egy vagy több példányban lehet jelen, leggyakrabban kettő szexuális fajban, az egyik anyai eredetű, a másik apai eredetű ( diploid organizmus ).
A genomot kutató tudomány genomika .
A genomot nem szabad összekeverni a kariotíppal , amely a kromoszómák elrendezésének makroszkopikus elemzése vagy leírása.
A vírusokban a genom a DNS ( DNS vírus ) vagy RNS ( RNS vírus vagy ribovírus) egy vagy több molekulájában található , egy- vagy kettős szálú, fehérje jellegű részecskében vagy kapszidban védett. Vannak, akik a vírusokat nem organizmusnak, hanem molekuláris parazitának tekintik. Valóban, úgy szaporodnak, hogy megfertőzik azokat az élő sejteket, amelyekbe genomjukat injektálják. Egyes vírusok, például a HIV-hez kötődő retrovírusok genomja RNS-ből áll, amely egyszálú vagy kétszálú. Bármi legyen is a nukleinsav, egyes vírusoké körkörös, másoké lineáris. A vírusgenom minden esetben sejtciklusának legalább egyik fázisában létezik kettős szálú DNS formájában.
A prokariótákban ( baktériumok és archeák ) a genom általában egy kör alakú DNS-molekulában található. Előfordulhat extrakromoszómális genom is, amelyet plazmidok és episzómák tartalmaznak . Egyes baktériumok, például az aktinomyceták , azonban lineáris genomokkal rendelkeznek.
Az eukariótákban megkülönböztethetünk:
Egyes eukariótákban (pl. Élesztő) plazmidok is vannak (csökkentett méretűek).
Emberben különösen (eukarióta organizmus), a nukleáris genom van elosztva a 46 kromoszómát , azaz 22 pár autosomes és két gonosomes (XX nőkben, XY férfiaknál).
A genom méretét a nukleotidok vagy bázisok számában mérjük . Legtöbbször a bp-ről beszélünk (az alappárok esetében , mivel a genomok többségét kettős DNS- szál vagy RNS alkotja ). Gyakran használják a kb (kilobázis esetén) vagy Mb (megabázis) többszöröseit , amelyek 1000, illetve 1 000 000 bázis. A genom nagysága pg-ben (pikogrammokban) is kifejezhető, amely megfelel a sejt (DNS) ( haploid ) tömegének sejtenként. 1 pg körülbelül 1000 Mb .
A genom mérete a vírusok néhány kilobázisától az egyes eukariótáknál több százezer Mb-ig változhat . A DNS mennyisége, ellentétben azzal, amit régóta feltételeznek, nem arányos egy szervezet látszólagos összetettségével. A szalamandrák , a tüdőhalak , néhány páfrány vagy egyes tűlevelűek, például a fenyők több mint tízszer nagyobb genommal rendelkeznek, mint az emberi genom. Ezt a megállapítást gyakran C-érték paradoxonnak nevezik .
A mai napig a legnagyobb ismert genommal rendelkező élő szervezet a lágyszárú növény, a Paris japonica ; körülbelül 150 milliárd bázispár hosszú, csaknem 50-szer akkora, mint az emberi genom .
Egyes amőbák , például az Amoeba dubia genomja még nagyobb lehet, akár 200-szor nagyobb, mint a Homo sapiensé . Ezt a meghatározást azonban vitatják, és torzíthatja az a tény, hogy ezek az egysejtű organizmusok számos más mikroorganizmust fagocitoznak, amelyek kromoszómáit beveszik, ami szennyezi a pontos DNS-tartalmuk meghatározását.
A genomok kódoló régiókból állnak, amelyek megfelelnek a géneknek, és a nem kódoló régiókból. A nem kódoló régiókat intergén szegmensek és a gének intronjai alkotják . A DNS-szekvenálás meghatározza a DNS-szálak nukleotidszekvenciáját a genom feltérképezéséhez.
Az élő szervezetek genomjában lévő gének száma sokkal kisebb mértékben változik, mint a genom mérete. A legtöbb élő organizmusban ez 1000 és 40 000 között van, és nincs összefüggésben a szervezetek látszólagos összetettségével sem. A Paramecium , test csillós egysejtű és egy genom tartalmazó több gén, mint az emberek. Az alábbi táblázat megadja a genom teljes méretét (beleértve azokat a heterokromatikus régiókat is, amelyek általában nem szekvenálva vannak), és számos olyan organizmusban jelen lévő gének számát, amelyek genomja teljesen szekvenálva van.
Szervezet | A gének száma | Genom méret |
---|---|---|
Haemophilus influenzae (baktériumok) | 1800 | 1,8 Mpb |
Escherichia coli (baktériumok) | 4,300 | 4,6 Mbp |
élesztő | 6000 | 12,1 Mpb |
Drosophila (rovar) | ~ 14 500 | 150,0 Mbp |
Fonálféreg | ~ 21 000 | 110,0 Mbp |
Arabette (virágos növény) | ~ 25 500 | 110,0 Mbp |
Egér | ~ 22 000 | 2700,0 Mpb |
Férfi | ~ 22 000 | 3400,0 Mbp |
Paramecium | ~ 40 000 | 72,0 Mbp |
Mivel a gének száma sokkal korlátozottabb arányban változik, mint a genom mérete, mivel a genom mérete növekszik (lásd az előző részt), a genom azon része, amely megfelel a kódoló régióknak, csökken. Növekszik az intronok, valamint az intergenikus régiók hossza . Az alábbiakban felsoroljuk a nem kódoló régiók különböző típusait, például az emberi genomban való arányukkal, amely reprezentatív az emlősök helyzetével:
A genomok a gének mellett gyakran tartalmaznak ál- géneket is . Ezek olyan szekvenciák, amelyeknek számos jellemzője van a géneknek ( kódoló szekvenciák , promóter szekvencia , jelek splicingjei ...), de amelyek nem működnek, és így nem vezetnek fehérje termeléséhez . Ez annak a genetikai mutációnak a következménye lehet, amely megváltoztatta szekvenciáját. Az emberi genom tehát körülbelül 20 000 álgént tartalmaz, ami gyakorlatilag annyi, ahány funkcionális gén van. A pszeudogének gyakran egy aktív gén duplikációi, amelyek megőrzik a sejt funkcionalitását . Így a funkcionális gén mellett számos pszeudogén található a genomban a citokróm c számára. Más esetekben a gén pszeudogénné történő átalakulása funkcióvesztéshez vezet, amikor ez az egyetlen aktív kópia, amelyet mutációk befolyásolnak. Genomunkban ez az L-guluno-γ-lakton-oxidázt kódoló gén, egy enzim, amely lehetővé teszi az aszkorbinsav szintézisét, amely pszeudogénné vált, ami azt jelenti, hogy étrendünkben minden nap el kell szívnunk a C-vitamint , mert nem tudjuk szintetizálni.
Nagy genomokban a nem kódoló régiók nagyobb része ismételt szekvenciákból áll, pontosabban diszpergált ismétlésekből . Arányuk a genom méretével is növekszik. Az emberi genomban ez az arány 45% körül mozog. A búza genomjában meghaladja a 80% -ot , amely ötszöröse az ember méretének.
A genom háromdimenziós konfigurációjának funkcionális jelentősége van: a hisztonoknak köszönhetően a DNS tekercselése (vagy " kondenzációja ") lehetővé teszi nagy mennyiségű genetikai információ " tárolását " a sejt apró sejtmagjában és lehetővé teszi a kromoszómák távoli részeinek egymáshoz való megérintését is, amikor DNS hurkok keletkeznek (ezek a hurkok lehetővé teszik két távoli gén együttes működését). A kromoszóma összehasonlítható egy gyöngy nyaklánccal, ahol minden gyöngy egy gén vagy a DNS többi "darabja", de funkciója nem "lineáris". Ebben az esetben egy gén ( egy gyöngy ) be- vagy kikapcsolásához ezt a gént össze kell kapcsolni azzal a DNS-sel, amely szabályozza vagy szabályozza annak aktivitását, vagy amelynek együttesen kell működnie ( egy másik gyöngy, kiegészítő forma ). Ez a másik gén meglehetősen messze található ezen a galléron ( vagy akár egy szomszédos galléron, azaz egy másik kromoszómán ).
Évtizedek óta a molekuláris biológusok erősen gyanakodnak arra, hogy a DNS háromdimenziós kikapcsolásának és kondenzálódásának módja kulcsfontosságú szerepet játszik ezeknek a kapcsolatoknak a lehetővé tételében, ahol és amikor szükség van rá, miközben növeli a mag képességeit. "Távoli gének közötti kölcsönhatások. .
A 2000-es évek eleje óta egy kicsit jobban megértjük a kapcsolatot a biokémiai és topológiai „ tippek ” között, amelyeket a genom használ a konfigurációjának változása során, a mitózis és / vagy meiosis különböző fázisaiban és állapotában. .
Új biomolekuláris technikákat dolgoznak ki egy DNS-darab (például egy gén) relatív helyzetének modellezésére vagy megfigyelésére más génekhez vagy DNS-darabokhoz viszonyítva, hogy meghatározhassák a " transzkripciós interakómát " (ami egyfajta az összes kölcsönhatásban lévő gén, ugyanazon organizmus összes kromoszómájának funkcionális kapcsolatainak feltérképezése); és ehhez az összetettséghez hozzá kell adnunk az epigenetika vagy a horizontális génátviteli kapcsolatok egyik fajtól a másikig ( például baktériumoknál ) is.
A 2009 , Erez Lieberman Aiden és kollégái készített egy módszer (valószínűségi modell) nevű Hi-C kívánó képviseli az összes egyidejű vagy lehetséges kapcsolatát a genomban. A felbontás problémájába ütköztek, amelynek során kezdetben csak két rekeszt tudtak megkülönböztetni, az egyik aktív DNS-t, a másik pedig a gének kikapcsolását ; ez a technika akkor csak a kibontott és a sejtmagból eltávolított DNS-en alkalmazható, ami fuzzy eredményekhez vezet. Ezért az ép magokban lévő gének vagy a genom más elemei közötti kapcsolatokat sokkal részletesebb információkat nyújtó módszerekkel igyekeztek feltérképezni (több millió bázis felbontásától kezdve olyan felbontásig, amely csak 1000 bázis elemének megfigyelését teszi lehetővé (jellemző Ezután a kifinomult számítógépes programok " 3D DNS-térképek " darabjait tudták előállítani (nyolc emberi sejtvonalra, beleértve a rákos vagy bázikus szöveteket, valamint egy. laboratóriumi egérrákos sejtvonalra).
Például egy emberi nyirokrákos sejtvonal esetében körülbelül 4 900 000 000 kontaktust detektáltak a különböző DNS-darabok között; más típusú cellák esetében az érintkezők száma 395 és 1100 millió között változott. Minél több az érintkezés, annál közelebb vannak az érintkező elemek a háromdimenziós térben.
2014-ben Rao, Huntley, Aiden és munkatársaik arra a következtetésre jutottak (a Cell folyóiratban ), hogy a genom körülbelül 10 000 hurokba rendeződik, és mindegyik sejttípus eltérő konfigurációjú, amely megfelel a DNS-fragmensek közötti különböző típusú érintkezésnek. Ezek a szerkezeti különbségek a génaktivitás különböző mintáit indukálják, meghatározva az egyes sejttípusokat Aiden szerint.
A (női) donorokból származó sejteken belül "gigantikus hurkok képződését észlelték az egyik X kromoszómában" . Ennek a huroknak az lehet a funkciója, hogy elhallgattassa a második X-kromoszómát annak érdekében, hogy lehetővé tegye a még aktív X-kromoszóma génjeinek megfelelő működését.
A csoport összehasonlította az egér rákos sejtek és az emberi rákos sejtek genomjának 3D térképeit. Ezek a térképek nagyon hasonlóak voltak, gyakran ugyanazokkal a hurkokkal, ami arra enged következtetni, hogy az a háromdimenziós szerkezet, amely meghatároz egy adott sejttípust, nem sokat változott emlősökben az evolúció során.
A különböző fajok genomjának teljes 3D-s térképeinek elkészítése lehetővé teszi a kutatók, az orvosok és a biotechnológiai ipar számára, hogy jobban megértsék vagy kihasználják a fajok genomjait. 2014-ben Aiden laboratóriuma már létrehozott egy alkalmazást és egy " Juicebox " nevű portált egy olyan keresőmotorral, amely a Google Earth-hez hasonlóan működik, ahol a kutatók a számukra érdekes gént felkutathatják a genom terében, és megnézhetik a vele fennálló kapcsolatokat. DNS-hurok, amelyet "megérint" . Ezeknek a térképeknek képesnek kell lenniük arra, hogy megerősítsék vagy megtagadják a genetikai betegségekben részt vevő egyes gének várható működését vagy a szervezet normális működését.
Felmerítik a DNS topológiájába ( transzgenesis útján ) gyakran - véletlenszerűen - bevitt gének közvetlen vagy közvetett hatásainak kérdését is .
A tudományos tudományág kutatja egy szervezet, egy szerv, egy rák stb. Működését. a genom és nem egy gén szintjén, a következőkkel:
A genom annotációja a nyers információt alkotó nukleotidszekvencia elemzéséből áll a biológiai információk kinyerése érdekében. Ez az elemzés két egymást követő célt követ, az első a gének és a kódoló régiók felkutatása, a második pedig, miután ezek a gének megtalálhatók, azonosítani vagy megjósolni azok biológiai funkcióját. Ez a két szakasz kezdetben kifinomult algoritmikus eszközök használatán alapul , amelyek fejlesztése a bioinformatika egyik területét képezi .
A gének felkutatásához különféle kiegészítő eszközök léteznek: statisztikai módszerek, amelyek a kodonfrekvencia- elemzés alapján azonosítják a kódoló régiókat, mintakeresési módszerek és különösen a jellegzetes kezdő és befejező aláírások, az intronok és az exonok közötti csomópontok , a promoter szekvenciák , a terminátorok , a riboszóma megkötő helyei (RBS).
Ezen gének potenciális működésének előrejelzéséhez (címke csatolása hozzájuk, valószínű nevük, valószínű funkciójuk, valószínű kölcsönhatások viselése) szekvencia homológiai kutatási programokat használnak . Amikor egy gén terméke megjósolja az ismert fehérjével való hasonlóságot, általában a funkció valószínű homológiájára következtetünk. A fehérje bizonyos csoportjaira ( kinázok , proteázok stb.) Jellemző aminosav- motívumok szintén azonosíthatók a megjósolt fehérjeszekvenciában , amelyek lehetővé tehetik a valószínű génfunkció hozzárendelését a megfelelő génhez. Ezt a fajta annotációt funkcionális annotációnak nevezzük .
Az annotáció lehet automatikus, vagyis kizárólag olyan algoritmusokra támaszkodhat, amelyek hasonlóságokat keresnek (a szekvencia, a szerkezet, a motívumok stb.), Lehetővé téve a gén működésének megjósolását (valójában kitalálását). Ez azt eredményezi, hogy a "hasonló" gén címkéjében megjelenő információk egy, a genomba már feljegyzett genomból "megjelennek".
A kezdeti automatikus megjegyzéseket néha kiegészítik a szakértők kézi feljegyzésével, akik tudásuk vagy kísérleti eredményeik szerint validálják vagy érvénytelenítik az előrejelzést. Ez így elkerülheti a hibák automatikus továbbítását és ezért azok terjedését, amely a genomika legfőbb problémájává válhat, tekintettel az új szekvenálási technikákból eredő hatalmas adatok beáramlására (lásd piroszekvenálás ).
A hónap tudományos és Vie magazinja 2019 január bejelenti, hogy "minden faj genomját 2028-ban meg kell szekvenálni".
A Earth BioGenome projekt ezt a célt tűzte ki célul az állatok, növények és más többsejtű fajok számára.
4000 ma ismert genommal szemben 2028-ban több mint 1,2 milliót kell számolnunk!