Genomický opičí byznys — přehodnocení odhadů podobnosti téměř identické DNA člověka a šimpanze s použitím původně vynechaných údajů
Nyní pracujeme na odborných a jazykových korekturách a na přípravě grafiky.
Link na článek v angličtině: creation.com/human-chimp-dna-similarity-re-evaluated
Jeffrey Tomkins a Jerry Bergman
Přezkumem rozšířeného tvrzení, že genomy člověka a šimpanze jsou téměř identické, se prokázala jeho vratkost, a to pouze na základě analýzy metodologie a údajů uvedených v řadě klíčových výzkumných publikací. Uváděné odhady vysoké podobnosti sekvencí DNA se opírají především o předem prověřené biologické vzorky a/nebo údaje. Data, která byla příliš odlišná na to, aby mohla být vhodně srovnána, se obvykle vynechávala, maskovala a/nebo zamlčovala. Kromě toho byly často vypouštěny i údaje o mezerách z konečných zarovnání, což dále zvyšovalo konečné odhady podobnosti. Právě tyto vysoce selektivní procesy vylučování dat, řízené darwinistickým dogmatem, vedou k běžně uváděné 98% podobnosti při porovnávání DNA člověka a šimpanze. Na základě analýzy údajů uvedených v různých publikacích, včetně často citované zprávy o šimpanzím genomu z roku 2005, lze bezpečně dospět k závěru, že podobnost lidského a šimpanzího genomu není větší než ~87 % a pravděpodobně ne větší než 81 %. Tyto opravené odhady jsou založeny na příslušných údajích, které se v obvykle prezentovaných konečných odhadech podobnosti neuvádějí.
Několik nedávných výzkumných zpráv potvrzuje výše uvedené závěry. Přestože nedávné srovnání chromozomu Y mezi člověkem a šimpanzem neumožňuje odhadnout podobnost celého genomu, je zjištěná extrémní odlišnost nepřekonatelným paradoxem pro společný původ v evoluci primátů, protože se jedná o zdaleka nejméně variabilní chromozom v lidském genomu. A konečně nedávná rozsáhlá výzkumná zpráva o srovnání genomu člověka a šimpanze podivuhodně potvrzuje údaje uvedené v této zprávě. Paradigma společného předka člověka a šimpanze je zjevně založeno spíše na mýtech a propagandě než na faktech.
Běžně se tvrdí, že DNA šimpanzů (Pan troglodytes) a lidí (Homo sapiens) je podobná přibližně z 98 %. Tento zjednodušující a často uváděný odhad může ve skutečnosti zahrnovat dva zcela odlišné pojmy: 1) obsah genů (poměrné počty podobných typů kódujících sekvencí přítomných nebo nepřítomných mezi různými druhy) a 2) podobnosti mezi skutečnými páry bází sekvencí DNA v zarovnáních. Moderní paradigma podobnosti se většinou vztahuje k výzkumu zarovnávání sekvencí DNA.
„Biologická sekvenční data často procházejí několika úrovněmi předběžného třídění, filtrování a výběru, než jsou shrnuta a diskutována.“
Jak si ukážeme, jedním z hlavních problémů celkového výzkumu v oblasti srovnávací genetiky je to, že ve většině studií se na dostupné biologické vzorky a data před konečnou analýzou aplikuje velké množství předvýběru. Pro konečnou analýzu se obvykle vybírají pouze nejslibnější data z většího souboru. Samozřejmě můžete porovnávat pouze to, o čem víte, že je vysoce srovnatelné, jinak ve většině případů není k dispozici žádné srovnání sekvencí. Biologická sekvenční data často procházejí několika úrovněmi předběžného třídění, filtrování a výběru, než jsou shrnuta a diskutována. Nezarovnatelné oblasti a mezery v zarovnáních sekvencí jsou v konečných výsledcích často vynechány nebo je jejich dopad zastřen. Jak je uvedeno níže, lze to provést různými způsoby a je třeba posuzovat každou zveřejněnou studii zvlášť.
První studie na lidech a šimpanzích používaly reasociační kinetiku
Původní odhady vysoké podobnosti lidské a šimpanzí DNA vycházely z oboru zvaného reasociační kinetika. Tyto počáteční zprávy podnítily první reakce takových populárních osobností evoluce, jako je oxfordský profesor Richard Dawkins, který prohlásil, že „šimpanzi a my sdílíme více než 99 % genů.“1 Ve své době se jednalo o odvážné tvrzení, protože počet genů u lidí a šimpanzů nebyl znám. První odhady lidského a šimpanzího genomu byly zveřejněny až v roce 2001 a potom 2005.2–5
Údajná data o genech, na které se Dawkins v roce 1986 odvolával, byla nepřímým odhadem založeným na reasociační kinetice smíšené lidské a šimpanzí DNA, nikoliv na jasně definovaných genech.1 Při reasociační kinetice se k rozdělení dvouvláknové DNA na jedno vlákno používá teplo a/nebo chemie. Pokud se DNA nechá kontrolovaně reasociovat, lze ji pomocí různých protokolů frakcionovat. Čím pomalejší je reasociace, tím složitější a hustší je DNA. Obecně lze získat tři typy DNA: s vysokým počtem kopií (vysoce repetitivní, chudá na geny), s nízkým počtem kopií (středně repetitivní, s nízkým počtem genů) a s jednou kopií (bohatá na geny). Pro srovnávací studie se odebere frakce DNA s jednou kopií od dvou druhů, smíchá se, disociuje a nechá se znovu asociovat, aby se lidská a šimpanzí DNA mohly rekombinovat. Úroveň shody komplementárních bází mezi vlákny lze nepřímo měřit různými metodami, které nepřímo měří rychlost / úroveň reasociace.
Proti tomu lze namítnout, že k získání prvních odhadů podobnosti byly použity pouze frakce s jednou kopií lidského a šimpanzího genomu. Vědci se zaměřili na frakci s jednou kopií kvůli vysokému obsahu genů. Mnoho genů se však nachází v jiných frakcích genomu, a proto byly z analýzy vynechány. Dalším problémem je, že prakticky celý genom je nyní známý jako funkční v určitém ohledu a bylo prokázáno, že nekódující oblasti poskytují mnoho kritických kontrolních funkcí a nukleotidových šablon.6,7,8
Tvrzení o 99% podobnosti, které Cohen nazývá „mýtus 1 %“, vyslovili poprvé v roce 1975 Allan Wilson a Mary-Claire Kingová, kteří využili postupu reasociační kinetiky DNA s jednou kopií.9 Objevily se další podobné studie s průměrnou divergencí DNA s jednou kopií, která činila asi 1,5 %, čímž vznikly široce rozšířené údaje o 98,5% podobnosti sekvencí DNA.10–12 Ačkoli byla v počátcích snahy o porovnání DNA skutečně vyloučena naprostá většina lidského a šimpanzího genomu, předpokládaná vysoká podobnost v relativně malých částech představovaných zlomky jednotlivých kopií vědce překvapila. Výsledný konsensus (podle Gibbonsova přehledu) byl ten, že dramatické rozdíly mezi anatomií a chováním lidí a šimpanzů vycházejí z předpokladu, že malé genetické rozdíly způsobují obrovské fyzické rozdíly.13
Genomický výzkum – potvrzení mýtu
Následný výzkum s využitím sekvenované DNA navázal na rané dogma o vysoké míře podobnosti, které bylo stanoveno na základě reasociační kinetiky. V jiném článku se zabýváme možností, že během prvních studií zahrnujících reasociační kinetiku byl stanoven nevyřčený „zlatý standard“ založený na dogmatech ohledně podobnosti člověka a šimpanze.14
Přehledový článek kreacionisty Todda Wooda o biologické podobnosti mezi člověkem a šimpanzem zdůraznil a zdánlivě potvrdil prohlášení o evoluční podobnosti, ale ignoroval důležité bioinformatické problémy týkající se rozsáhlého vynechávání dat a selektivních analýz.15 Woodův přehled nijak zvlášť nepodporuje tvrzení kreacionistů, že člověk byl jedinečně stvořen k obrazu Božímu, místo aby byl od šimpanze vzdálen jen několik párů bází DNA. Proto se v našem příspěvku zaměříme na podobnost sekvencí DNA a kromě několika novějších prací se budeme zabývat stejnými publikacemi, které jsou uvedeny ve Woodově přehledu. Souhrnné údaje z těchto studií včetně odhadů podobnosti upravených o vynechané údaje jsou uvedeny v tabulce 1.
Tabulka 1. Souhrn prací o porovnání genomu člověka a šimpanze. Tam, kde je to možné, se k určení skutečné procentuální identity DNA používají vynechaná data z nahlášených zarovnání.
Odkaz | Celkový počet analyzovaných genomických bází | Zarovnané základy | Ohlášená identita DNA | Skutečná identita DNA* |
Britten, 2002 | 846 016 | 779 132 | 95,2% | ~ 87% |
Ebersberger et al., 2002 | 3 000 286 | 1 944 162 | 98,8% | < 65% |
Liu et al., 2003 | 10 600 000 (celkem člověk, šimpanz, pavián a kosman) | 4 968 069 (člověk – šimpanz) | 98.9 % bez indelů | ? |
Wildman et al., 2003 | ~90 000 (exony z 97 genů) | ? | 98,4–99,4% | ? |
Šimpanz Chrom. 22 Consort. | 32 799 845 | ? | 98.5 % bez indelů | 80-85 % včetně indelů |
Nielson et al., 2005 | ? | ? | 99.4% vybraných genových oblastí | ? |
Šimpanz Seq. Consort. 2005 | Celý genom (5x redundantní pokrytí) | 2.4 Gb | 95,8% | 81%** |
* Na základě množství vynechaných sekvencí DNA v zarovnáních ** V porovnání s údaji z The International Human Genome Sequencing Consortium (2004)-((.9577 x 2,4 Gb) / 2,85 Gb) x 100? Nelze vypočítat skutečné procento identity, protože nebyly poskytnuty údaje.
Jedna z prvních prací o sekvenci lidské a šimpanzí DNA, která se objevila na začátku projektu šimpanzího genomu, byla možná jednou z nejobjektivnějších. Roy Britten, jeden z prvních průkopníků v oblasti reasociační kinetiky DNA, porovnal genomovou sekvenci pěti šimpanzích klonů s velkou vloženou DNA (bakteriálních umělých chromozomů, BAC16) s lidskou genomovou sekvencí pomocí atypického počítačového programu ve fortranu, který nebyl/není veřejně dostupný.17 Těchto pět šimpanzích sekvencí BAC bylo vybráno proto, že byly jediné tehdy dostupné.18 Výzkumníci obvykle vybírají počáteční zárodečné BAC pro sekvenování genomu kvůli obsahu jedné kopie DNA, což usnadňuje jejich sestavení a porovnání s jinými druhy. Celková délka sekvence DNA pro všech 5 BAC byla 846 016 bází. Pouze 92 % z nich však bylo možné přiřadit k lidské DNA, takže konečná statistika uvádí pouze 779 132 bází. K Brittenově cti slouží, že zahrnul údaje o zarovnání inzerce a delece (indely) a uvedl podobnost člověka a šimpanze ~95 %. Realističtější údaj by však zahrnoval kompletní vysoce kvalitní sekvenci všech pěti BAC, která je stejně legitimní jako indely v rámci zarovnání; výsledná podobnost DNA je 87 % (tabulka 1). Viz obrázek 1, který graficky znázorňuje koncept indelů a substitucí v párovém zarovnání dvou sekvencí DNA.
Obrázek 1. Ilustrace ukazující možné námitky k modelu hypotetického párového zarovnání mezi homologickými sekvencemi dvou různých druhů (seq1 a seq2). První námitka spočívá v tom, že téměř ve všech zarovnáních existují části srovnávaných sekvencí mimo zarovnané oblasti, které jsou obvykle vynechány, ale představují platné rozdíly. Inzerce a delece (indely) v rámci zarovnání představují přidání nebo ztrátu sekvence DNA v jedné sekvenci ve srovnání s druhou. Indely mohou mít velikost od jedné báze až po tisíce bází. Někdy se s nimi počítá při zarovnávání a někdy se vynechávají. Substituce jsou báze, které se liší mezi dvěma sekvencemi a ve většině případů jsou zahrnuty do výsledků zarovnání.
Další pozoruhodná studie, kterou publikovali Ebersberger et al. ve stejném roce, kdy vyšel Brittenův článek, využívala sekvenci šimpanzího genomu získanou z náhodně sestříhaných, velikostně vybraných fragmentů v rozsahu 300 až 600 bází.19 Tyto sekvence DNA byly zarovnány k rané verzi sestavy lidského genomu pomocí algoritmu BLAT (Blast-Like Alignment Tool). Výzkumníci vybrali dvě třetiny z celkové sekvence pro podrobnější analýzy. Třetina šimpanzí sekvence se neshodovala s lidským genomem a byla vyřazena. Metodická část článku19 popisuje, jak byla podskupina předem prověřených dat dále filtrována, aby se získala pouze ta nejlepší zarovnání. Výsledná data byla následně podrobena řadě srovnávacích analýz, které jsou vzhledem k extrémně vysoké míře selekce, maskování a filtrování dat prakticky zcela bezvýznamné. Není překvapivé, že mezi člověkem a šimpanzem je rozdíl pouze 1,24 %, a to jen ve velmi podobných zarovnaných oblastech. Realističtější sekvenční podobnost založená na vlastních číslech badatelů pro vyřazená data v samotných zarovnáních není vyšší než 65 % (tabulka 1).
Krátce po těchto prvních článcích srovnávajících lidi a šimpanzy se rychle objevil znepokojivý trend. Tento trend zahrnoval pouze uvádění konečných výsledků zarovnání a vynechání konkrétních údajů o tom, jak byla tato data filtrována, maskována a vybírána. Klíčové údaje, které umožňují kritickým čtenářům článků o podobnosti lidí a šimpanzů vypočítat přesnější celkovou podobnost, začaly být důsledně opomíjeny. Například Liu et al. podali zprávu o zarovnání lidské genomové sekvence se šimpanzem, paviánem a kosmanem.20 Důležité informace týkající se výchozího souboru sekvencí a konkrétních údajů pro zarovnání byly vynechány. Uvádějí pouze, že použili celkem 10,6 Mb sekvence pro všechny druhy dohromady. Jejich odhad podobnosti u konečného zarovnání, bez indelů a nezarovnaných oblastí, byl 98,9 %. Včetně indelů jsme získali hodnotu 95,6 % pro zarovnání, podobně jako v Brittenově výzkumu. Důležité údaje mimo zarovnané oblasti nebylo možné vyhodnotit kvůli vynechaným sekvenčním údajům.
Dalším znepokojivým trendem je, že pro vykazování podobnosti celého genomu se často používají pouze vysoce konzervativní sekvence kódující proteiny (exony). V současné době víme, že sekvence nekódující proteiny, které tvoří více než 95 % genomu, mají zásadní význam pro všechny aspekty genetiky a funkce genomu.8 Pro trend srovnávat pouze exonové sekvence je typické, že Wildman et al. referovali o studii, která srovnávala pouze lidské a šimpanzí oblasti kódující protein 97 exonových fragmentů o celkovém počtu 90 000 bází.21 Předem vybrané exony byly založeny na tom, že se vyskytovaly jak u lidí, tak u šimpanzů a bylo již známo, že jsou vysoce srovnatelné. Kvůli těmto problémům se zkreslením a nedostatku podrobností v materiálech a metodách nelze v tomto případě dospět k platnému odhadu vynechaných údajů a skutečné podobnosti (tabulka 1).
V roce 2004 Watanabe et al. použili různé knihovny BAC k výběru klonů pro sekvenování DNA reprezentující šimpanzí chromozom 22.22 Získanou sekvenci pak porovnali s jeho podobným lidským homologem. Proti tomu lze namítnout, že jednotlivé šimpanzí klony BAC byly vybrány pouze tehdy, pokud každý z nich obsahoval 6 až 10 lidských DNA markerů. Opět zde dochází k počátečnímu zkreslenému předvýběru. V tomto případě se tak děje ještě předtím, než jsou data o sekvenci DNA vygenerována. V článku ani v doplňkových informacích bohužel nejsou uvedeny kritické celkové statistiky zarovnání DNA. Autoři uvádějí rychlost nukleotidových záměn 1,44 % v zarovnaných oblastech, ale neuvádějí odhady podobnosti, které by zahrnovaly indely. Autoři sice vynechávají indely z podobnosti zarovnání, ale uvádějí, že jich bylo 82 000, a poskytují histogram, který graficky znázorňuje rozložení velikosti na základě binovaných skupin dat. Kupodivu nebyly poskytnuty žádné údaje o průměrné velikosti nebo celkové délce indelů. Stejně tak byl uveden počet sekvenčních mezer, ale nic o kumulativní velikosti mezer. Přestože se porovnávají údajně dobře sekvenované ortologní chromozomální oblasti, konkrétní údaje, které by umožnily vypočítat celkovou podobnost DNA, nápadně chybí. Na základě odhadu s využitím omezených grafických údajů o záměnách bází a indelů lze odvodit hrubý a poměrně konzervativní odhad celkové podobnosti přibližně 80 až 85 % (tabulka 1).
Jednu z nejrozpornějších studií o vztahu lidí a šimpanzů publikovali Nielson et al.23 V souladu se zavedeným zamlžovacím trendem byly použity pouze vysoce konzervované exony a nebyly uvedeny žádné údaje, které by umožnily vypočítat jakýkoli typ skutečné celkové podobnosti. Z celkového počátečního počtu genových sekvencí v analýze (20 361) se vědci rozhodli vyřadit 33 % (6 630) v rámci nejasně uvedené „velmi konzervativní kontroly kvality“. Jinými slovy, třetina původních šimpanzích dat se neshodovala s lidskými, a proto byla vyřazena. Ve skutečnosti nebyla uvedena žádná tvrdá data, která by umožnila posoudit i poslední dvě třetiny srovnávaných šimpanzích dat. Autoři uvádějí pouze divergenci sekvenčních substitucí mimo „tichá místa“. Tato „tichá místa“ jsou oblasti, kde byla data vyřazena; představují lokace, kde genetická variabilita údajně vykazuje malý nebo žádný vliv na funkci genomu. Tento mylný předpoklad se stává předmětem zkoumání vzhledem k tomu, že většina nekódujících částí genomu je nyní prokazatelně funkčně aktivní. Zcela vynechány byly také údaje o důležitých indelových rozdílech. Bohužel v této velmi mlhavé zprávě nebyl uveden dostatek údajů, aby bylo možné provést alespoň hrubý výpočet podobnosti.
Data z hrubého návrhu sestavení genomu šimpanze – 81% podobnost?
Významným mezníkem v oblasti porovnávání genomu člověka a šimpanze je článek Mezinárodního konsorcia pro sekvenování genomu šimpanzů z roku 2005 v časopise Nature.4 Tento článek bohužel pokračuje v dříve zavedeném trendu, kdy se většina srovnávacích údajů uváděla ve velmi selektivní a mlhavé podobě a chyběly podrobné informace o zarovnáních. Většina práce se zabývá především různými hypotetickými evolučními analýzami pro různé rychlosti divergence a selekční síly. Proto se autoři pečlivě vyhýbají kritické otázce celkové podobnosti.
Na základě čísel uvedených v článku o šimpanzím genomu však lze určit přibližnou celkovou podobnost genomu člověka a šimpanze, a to po zahrnutí současně zveřejněných informací z projektu lidského genomu. Pokud jde o celkové zarovnání, autoři uvádějí, že „nejlepší vzájemné zarovnání šimpanzího a lidského genomu na úrovni nukleotidů pokrývá ~2,4 gigabází (Gb) vysoce kvalitní sekvence.“24 V té době bylo odhadováno, že lidské euchromatické sestavení je z 99 % kompletní a má velikost 2,85 Gb a chybovost 1 ze 100 000 bází.25 Autoři šimpanzího genomu uvádějí: „Rozdíly v indelech mezi genomy tedy činí ~90 Mb. Tento rozdíl odpovídá ~3 % obou genomů a je menší než 1,23% rozdíl vyplývající ze záměn nukleotidů.“26
Souhrnně lze konstatovat, že pouze 2,3 Gb šimpanzích sekvencí bylo zarovnáno na vysoce přesný a kompletní lidský genom (2,85 Gb), což je operace, která zahrnuje maskování sekvencí s nízkou složitostí. U šimpanzí sekvence, která se zarovnala, ukazují údaje o substitucích a indelech 95,8% podobnost, což je zkreslený údaj, který nezahrnuje maskované oblasti. Na základě těchto čísel lze při celkovém odhadu šimpanzí a lidské DNA získat konzervativní odhad podobnosti celého genomu ve výši 80,6 %. V roce 2005 bylo dosaženo pětinásobného redundantního pokrytí šimpanzího genomu, což mělo představovat více než 95 % celkové sekvence.
Woodova zpráva obsahuje analýzu, která se pokouší potvrdit platnost celé sestavy šimpanzího genomu z roku 2005.27 Woodovo srovnání člověka a šimpanze použilo odvozené sekvence aminokyselin z genových ortologů, o nichž je již známo, že jsou podobné, a tudíž srovnatelné. Porovnání aminokyselin proteinů mezi elektronicky přeloženými kódujícími sekvencemi známých ortologů je stěží přesným ukazatelem podobnosti sekvencí DNA v celém genomu. Ortology jsou geny u různých druhů, u nichž se předpokládá, že se vyvinuly ze společného genu předků, především proto, že mají u obou druhů stejnou funkci a podobnou sekvenci. Porovnání aminokyselin mezi elektronicky přeloženou kódující sekvencí známých ortologů také není přesným ukazatelem podobnosti sekvencí celého genomu, protože méně než 5 % lidského genomu skutečně obsahuje sekvenci kódující proteiny. Další problém s používáním elektronicky generovaných proteinů pro porovnávání je zdůrazněn skutečností, že většina savčích genů prochází alternativní transkripcí a translačními start / stop místy, vícenásobnými mechanismy sestřihu exonů, intragenovými regulačními segmenty kódujícími RNA, enhancerovými elementy a mnoha dalšími složitými prvky transkripčního kódu.28,29 Ve světle našich současných znalostí o tom, jak genom skutečně funguje, je třeba, aby zastaralý přístup spočívající v používání elektronicky odvozených sekvencí jaderných proteinů pro mezigenomová srovnání vážně přehodnotili jak evolucionisté, tak kreacionisté.
Paradigma člověk – šimpanz se začíná rozpadat
V návaznosti na Woodovo shrnutí15 některých hlavních prací, které se zabývaly mýtem o podobnosti člověka a šimpanze, se objevilo několik zásadních zpráv zpochybňujících dogma evolučního paradigmatu člověka a primátů. První z nich byla studie Ebersbergera et al., v níž byl při konstrukci fylogeneze (vícenásobné zarovnání analyzované ve formátu evolučního stromu) použit velký soubor genomových sekvencí člověka, šimpanze, orangutana, nosorožce a gorily.30 Původní pool sekvencí DNA ve skutečnosti prošel několika úrovněmi selekce, která je předem analyzovala, ořezala a filtrovala pro optimální zarovnání. Nejprve byl vybrán soubor 30 112 sekvencí, které sdílely homologii (překrývající se podobnost) mezi pěti druhy. Tyto sekvence byly zarovnány, přičemž pouze ty, které daly zarovnání ≥ 300 bází, byly ponechány pro další sérii zarovnání a pouze sekvence, které daly lepší statistickou pravděpodobnost > 95 %, byly použity v konečné analýze. Tento filtrační proces odstranil více než 22 % již známých, předem vybraných homologických sekvencí. Přes veškeré filtrování dat, jehož cílem bylo vytvořit co nejpříznivější evoluční zarovnání a stromy, výsledky neprokázaly žádnou jasnou společnou cestu předků člověka se šimpanzem nebo některou z velkých opic. Vznikla tak skutečná mozaika jedinečných sekvencí lidské a primátí DNA, která vylučuje jakoukoli jasnou dráhu společného původu. Asi nejlepší shrnutí výzkumu lze nalézt ve slovech samotného autora.
„V přibližně 23 % našeho genomu nesdílíme s naším nejbližším žijícím příbuzným, šimpanzem, žádné bezprostřední genetické předky.
„Ve dvou třetinách případů tak vzniká genealogie, v níž si lidé a šimpanzi nejsou navzájem nejbližšími genetickými příbuznými. Odpovídající genealogie se neshodují s druhovým stromem. V souladu s experimentálními důkazy to znamená, že neexistuje nic takového jako jedinečná evoluční historie lidského genomu. Spíše se podobá mozaice jednotlivých regionů, které se řídí vlastní genealogií.“31
Autoři dodávají, že nedostatek podpory pro konzistentní a jasný evoluční strom mezi lidmi a ostatními primáty je způsoben „inkluzí zarovnání bez jasného fylogenetického signálu“,32 což je významné tvrzení vzhledem k tomu, že použili extrémně vysokou úroveň filtrování a selekce dat, která měla poskytnout obrovské množství „fylogenetických signálů“.
Senzační chromozom Y
Jednou ze zpráv, které v posledních letech nejvíce narušily dogma, je srovnání chromozomu Y mezi lidmi a šimpanzi.33 V této studii byla porovnávána mužsky specifická oblast (MSY), velká oblast chromozomu Y, mezi člověkem a šimpanzem. K tomu bylo nutné provést poměrně rozsáhlé resekvenování, protože šimpanzí sekvence v této oblasti byla fragmentovaná a neúplná. Konečným výsledkem bylo 25 800 000 bází vysoce přesné sekvence šimpanzího chromozomu Y, rozdělených do osmi sousedících segmentů. Ve srovnání s lidským chromozomem Y byly rozdíly obrovské. Autoři uvádějí: „Přibližně polovina šimpanzí amplikonové sekvence nemá homologní, zarovnatelný protějšek v lidské MSY a naopak.“34 Amplikonová sekvence obsahuje zdobné opakovací jednotky (tzv. palindromy), které se čtou stejně dopředu jako dozadu. Mezi těmito palindromy jsou rozptýleny rodiny genů, které se exprimují především v mužských varlatech. Nejenže se 50 % tohoto typu sekvencí mezi lidmi a šimpanzi v chromozomu Y nepodařilo zarovnat, ale lidé měli více než dvakrát více genů (60 u lidí oproti 25 u šimpanzů). Byly také nalezeny tři kompletní kategorie genů (genové rodiny), které se vyskytovaly u lidí, ale ne u šimpanzů. V souvislosti s tímto velkým rozdílem v obsahu genů autoři poznamenávají, že „navzdory propracované struktuře šimpanzí MSY je její genový repertoár podstatně menší a jednodušší než u lidské MSY,“35 a „šimpanzí MSY obsahuje pouze dvě třetiny odlišných genů nebo genových rodin lidské MSY a pouze polovinu transkripčních jednotek kódujících proteiny.“35
Kromě těchto genů výrazně mužského typu byly charakterizovány i další oblasti, které obsahovaly geny označované jako „X-degenerované“, což je poněkud zavádějící termín založený na předpokladu, že X-degenerované geny mají homology na ženském chromozomu X, z něhož se podle evolucionistů vyvinuly. Srovnání oblastí genů X-degenerace mezi lidmi a šimpanzi ukázalo kromě rozdílů v obsahu genů také výrazné organizační a lokalizační rozdíly. Lidé mají ve skutečnosti tři typy (třídy) X-degenerovaných genů, které se nevyskytují ani u šimpanzů.
Kromě velkých rozdílů v obsahu genů mezi lidskými a šimpanzími oblastmi MSY byly obrovské i celkové strukturální rozdíly. Všimněte si některých doplňujících komentářů autorů:
„Sekvence MSY zachované v obou liniích navíc nadprůměrně podléhaly přeskupování: porovnání celých chromozomů s bodovou tabulkou šimpanzího a lidského MSY ukazuje výrazné rozdíly v hrubé struktuře.
„Šimpanzí amplikonové oblasti jsou obzvláště masivní (o 44 % větší než u člověka) a architektonicky zdobné, s 19 palindromy (ve srovnání s osmi u člověka) a propracovaným zrcadlením nukleotidových sekvencí mezi krátkým a dlouhým ramenem chromozomu, což je rys, který se u člověka v MSY nevyskytuje.
„Z 19 šimpanzích palindromů se pouze 7 vyskytuje také v lidské MSY; zbylých 12 je specifických pro šimpanze. Na rozdíl od lidské MSY existují téměř všechny šimpanzí palindromy MSY ve více kopiích.“34
Velké rozdíly ve strukturálním uspořádání jedinečných znaků DNA i v obsahu genů, popsané ve studii o chromozomu Y, obzvláště poškozují mýtus o podobnosti DNA člověka a šimpanze a dogma o evoluci primátů. Ve skutečnosti autoři uvádějí šokující příklad, že vzhledem „… k 6 milionům let odstupu je rozdíl v obsahu genů MSY u šimpanze a člověka srovnatelný spíše s rozdílem v obsahu autozomálních genů u kuřete a člověka při odstupu 310 milionů let.“35
„Hlavním problémem těchto drastických rozdílů mezi lidskými a šimpanzími chromozomy Y je, že je evoluční dogma nedokáže vysvětlit.“
Hlavním problémem těchto drastických rozdílů mezi lidskými a šimpanzími chromozomy Y je, že je evoluční dogma nedokáže vysvětlit. Rozsáhlá studie genetické variability lidského genomu ukázala, že chromozom Y je mimořádně stabilní a má pětkrát menší genetickou variabilitu než autozomy.36 Tento údaj dává dokonalý smysl, protože chromozom Y nemá v genomu žádný podobný homolog a během meiózy prochází jen velmi malou rekombinací s chromozomem X. Vzhledem k tomuto nedostatku rekombinace a sekvenční rozmanitosti chromozomu Y naráží model evoluce primátů na vážný problém, protože lidské a šimpanzí chromozomy Y by si měly být podstatně podobnější. Evolucionisté považují vysokou úroveň variability sekvencí DNA za pozitivní ukazatel míst v genomu, která se rychle vyvíjejí. Protože se tedy chromozom Y tak výrazně liší od šimpanze, měl by mít známky takové aktivity, ale nemá je. Místo toho se zdá, že je velmi statický a stabilní, s velmi malými strukturními rozdíly a malou sekvenční rozmanitostí mezi muži lidského druhu po celém světě. Prokázaná stabilita chromozomu Y ve srovnání se zbytkem lidského genomu v kombinaci s velkými rozdíly mezi člověkem a šimpanzem představuje pro paradigma společného původu člověka a šimpanze nepřekonatelnou záhadu.
Některé případy vysoké podobnosti mohou být způsobeny kontaminací
Dalším faktorem, který je třeba vzít v úvahu při debatě o podobnosti člověka a šimpanze, je skutečnost, že některé případy vysoké sekvenční podobnosti mohou být způsobeny kontaminací. Nejenže sestavení šimpanzího genomu stále z velké části vychází z lidského genomu, ale nyní se také ukazuje, že rozsáhlá kontaminace databází neprimátů lidskou DNA je vážným problémem a v některých případech může dosahovat až 10 %.37 Lidská kontaminace je důsledkem procesu klonování fragmentů DNA v laboratoři pro sekvenování, kdy se do nich lidské buňky dostávají vzduchem z kašle, kýchání a fyzického kontaktu s kontaminovanými prsty. Odhalení a charakterizace kontaminace lidské DNA v databázích primátů by mohlo být obtížnou a velmi subjektivní záležitostí kvůli převažujícímu dogmatu o evoluci primátů. Za zmínku stojí také to, že šimpanzí genom byl sekvenován v době, kdy ještě nebyla dostatečně odhalena rozsáhlá kontaminace lidskou DNA. Problém kontaminace je také komplikován použitím lidského rámce pro sestavování a anotaci šimpanzích sekvencí.
Kontaminace není pouze umožněna laboratorní chybou, ale je cíleně vytvářena při sestavování a anotaci šimpanzího genomu na základě darwinistického dogmatu. Na nedávno založené webové stránce databáze Ensembl (společný bioinformatický projekt EMBL-EBI a Wellcome Trust Sanger Institute) je na stránce nazvané „Chimp Genebuild“ uvedena následující informace o jednom ze způsobů, jakým se lidský genom používá jako vodítko při sestavování a anotaci šimpanzího genomu:
„Vzhledem k malému počtu proteinů (z nichž mnohé se zarovnávají na stejné místo) byla přidána další vrstva genových struktur projekcí lidských genů. Kvalitní anotace lidského genomu a vysoký stupeň podobnosti mezi lidským a šimpanzím genomem nám umožňují identifikovat geny u šimpanze přenosem lidských genů na odpovídající místo u šimpanze.
„Transkripty genových struktur člověka kódující proteiny se promítají pomocí WGA [sestavení celého genomu] na chromozomy v šimpanzím genomu. Malé inzerce / delece, které narušují čtecí rámec výsledných transkriptů, se korigují vložením intronů s posunem rámce do struktury.“38
Nejenže je šimpanzí genom sestaven na základě lidského genomu, ale připouští se i kontaminace lidskými sekvencemi, protože byly elektronicky přidány, aby doplnily domnělé chybějící šimpanzí sekvence. Na základě mýtu a dogmatu, podle nějž má být lidská DNA téměř totožná se šimpanzí, byly do mezer a oblastí šimpanzího genomu vměstnány kousky lidské DNA, aby se jevil více lidský. Výsledkem je, že při stahování sestavené a anotované sekvence šimpanzího genomu pro nezávislé studium nemá badatel k dispozici 100% objektivní sekvenci šimpanze, jak se často předpokládá. Namísto toho je zde mozaika lidských a šimpanzích sekvencí, která je poskládána, srovnána a orientována podle lidského genomu.
Závěr – lidská a šimpanzí DNA si nakonec nejsou tak podobné
Šimpanzí genom ve své konečné anotované a sestavené podobě je zjevně neobjektivní produkt. Kromě toho téměř všechny výzkumné zprávy o podobnosti lidské a šimpanzí DNA vynechávají značné množství dat, která se neshodují nebo představují mezery v sekvenci. Ve skutečnosti značný počet prací ani neobsahuje dostatek údajů, aby nezávislý čtenář mohl zjistit, jak velká byla původní rozdílnost před uvedením konečných, vysoce filtrovaných čísel. Pokud jde o odhad podobnosti genomu člověka a šimpanze na základě údajů uváděných (ale často hluboko ukrytých) v publikovaných zprávách, lze s jistotou tvrdit, že není vyšší než 81 až 87 % a dost možná nižší.
Na podporu tohoto závěru byl nedávno v samostatném časopise publikován rozsáhlý výzkumný projekt srovnávání genomu člověka a šimpanze.39 Tato studie zcela dokládá a potvrzuje údaje uvedené v této zprávě. V této studii autor Tomkins uvádí údaje o párovém zarovnání 40 000 náhodných šimpanzích genomových sekvencí, které porovnává se čtyřmi různými verzemi lidského genomu pomocí algoritmu BLASTn spuštěného při 30 různých kombinacích parametrů. Toto úsilí přineslo celkem 1,2 milionu pokusů o zarovnání – 4,8 milionu, pokud vezmeme v úvahu čtyři různé sestavy lidského genomu. S vyloučením údajů o velkém množství šimpanzích sekvencí, které nebyly zarovnány, Tomkins uvedl velmi konzervativní odhad podobnosti lidské a šimpanzí DNA pouze v zarovnaných oblastech na 86-89 % (v závislosti na parametrech algoritmu). Výsledky této rozsáhlé a velmi objektivní studie jednoznačně ukazují, že mezi genomy člověka a šimpanze je shoda nejméně o 10-12 % menší, než se běžně tvrdí. Paradigma společného předka člověka a šimpanze, které tvrdí, že obsah DNA je téměř totožný, je zjevně založeno spíše na mýtech a propagandě než na skutečných faktických údajích.