V lidském genomu lze o 20% méně informací zašifrovat, než se dříve myslelo. V nové studii mezinárodní tým vědců ukázal, že pouze 80% genů v lidské DNA skutečně kóduje všechny proteiny, zatímco zbytek ztratil tuto schopnost. Výsledky výzkumu jsou publikovány v časopise Nucleic Acids Research.
V lidském genomu je 23 párů chromozomů. Obsahují asi 28 000 genů, ale ne všechny mají dědičné informace nezbytné pro syntézu proteinů. Někteří vykonávají určitou pomocnou funkci, zatímco jiní nedělají vůbec nic, protože ztratili schopnost kódovat proteiny v procesu evoluce a četných mutací. Takové oblasti se nazývají pseudogeny. Tým vědců ze Španělska, Velké Británie a Spojených států zjistil, že pětina lidského genomu jsou nefunkční pseudogeny.
Autoři porovnávali databáze ze tří různých výzkumných projektů genomu: GENCODE / Ensembl, RefSeq a UniProtKB. Celkem vědci našli 22 210 genů, které nesou informace o jakémkoli proteinu. Pouze 19 446 z nich skončilo ve všech třech databázích. Poté vědci začali analyzovat zbývajících 2764 genů a zjistili, že téměř všechny z nich jsou ve skutečnosti pseudogeny, to znamená, že nekódují žádný protein. Navíc bylo k tomuto počtu přidáno dalších 1 460 genů, které byly uvedeny ve všech třech databázích.
Celkově v důsledku studie vědci našli 4234 pseudogenů. Tyto informace již byly přidány do databáze mezinárodního projektu GENCODE. Nyní musí vědci zkontrolovat tato data podrobným studiem každého z objevených pseudogenů. Po ověření již 300 z nich již dostalo status „pseudogen“.