Analiza międzynarodowej bazy genomów koronawirusa

Strona przystosowana do oglądania jedynie na monitorze komputera (interaktywny wykres).

Każdy nowy genom wirusa niesie ze sobą informację o historii jego mutacji. Częstość mutowania skorelowana z wynikami sekwencjonowania danego szczepu wirusa pozwalają nawet odtworzyć ścieżkę zakażeń. W tym artykule opisujemy rezultat analizy bioinformatycznej poświęconej wynikom sekwencjonowania koronawirusa SARS-CoV-2 z całego świata.

Międzynarodowa baza GISAID

Inicjatywa GISAID początkowo powstała, aby udostępniać dane o wirusach grypy, jednak w obliczu trwającej epidemii baza została dostosowana również do publikacji informacji o zidentyfikowanych wirusach SARS-CoV-2. Udostępniane są tutaj zatem wyniki sekwencjonowania nowego koronawirusa z całego świata.

Na końcu lipca w bazie znajdowało się ponad 80.000 rekordów. Najwięcej koronawirusów na świecie zsekwencjonowano w tym roku w Wielkiej Brytanii (powyżej 30.000), na drugim miejscu uplasowały się Stany Zjednoczone (powyżej 17.000), dalej Australia i Hiszpania, każda z ponad 2.700 sekwencjami wirusa. W Polsce inicjatywę GISAID w gromadzeniu bazy genomów koronawirusa oprócz genXone SA wsparło również sześć innych instytucji. W wyniku tego z końcem lipca dostępnych było w bazie 115 sekwencji koronawirusów z Polski.

Mutacja koronawirusa w skali świata

Z przeprowadzonej analizy bioinformatycznej wynika, że koronawirus SARS-CoV-2 mutuje zdecydowanie wolniej niż wirus grypy czy wirus HIV. Jednak mimo wszystko zmiany w jego genomie postępują. U poszczególnych koronawirusów obserwujemy różnice względem pierwotnego wirusa z Wuhan w dziesięciu i więcej nukleotydach spośród pełnej sekwencji jego nici RNA, a średnia (mediana) tych różnic wynosi 8. Co ciekawe, w samej Polsce średnia ta wynosi aż 10 nukleotydów różnicy od sekwencji genomu pierwotnego wirusa z Wuhan. Może być to spowodowane faktem, że wirus dotarł do nas później i zdążył w tym czasie zmutować.

Jak tłumaczy dr Maciej Sykulski – Koordynator ds. Naukowych genXone: “Obserwowana w analizie prędkość pojawiania się mutacji u obecnego koronawirusa oznacza jedną, nową zmianę nukleotydu z prawie każdym kolejnym zarażeniem. Ten fakt daje nam pewną przewagę – jest to możliwość prześledzenia łańcucha zakażeń wśród ludzi jedynie przy pomocy analiz sekwencji wirusowych genomów”.

Mapa genetyczna koronawirusa

Porównane genomy koronawirusów pozwalają stworzyć coś na kształt drzewa genealogicznego, na którym w każdym momencie wystąpienia mutacji wirusa powstają kolejne rozwidlenia. Śledzenie tych rozgałęzień pozwala przede wszystkim poznać kierunki przepływu wirusów pomiędzy różnymi regionami świata:

Interaktywna mapa genetyczna koronawirusa na próbce danych z wybranych krajów. Odstępy na mapie przybliżają odległość genetyczną między próbkami (PCoE metodą Sammona). Dane GISAID EpiCOV z początku sierpnia 2020. Autor: Maciej Sykulski genXone.

Na mapie widoczne są gałęzie wirusa bliższe sekwencji bezpośrednio z Wuhan, czyli szczep B, a także występujący w pozostałych regionach Chin – szczep A. Co ciekawe, znaczący procent wirusów w Hiszpanii wywodzi się właśnie z chińskich gałęzi. Znacząco odróżnia to Hiszpanię od wyników europejskich, gdzie w większości dominują szczepy B.1 oraz B.1.1. Te dwa najliczniej występujące w Europie szczepy dopiero po europejskim debiucie później trafiły na kolejne kontynenty. Charakterystyczne dla szczepów B.1 i B.1.1 jest to, że posiadają one mutacje w sekwencji ORF1ab (4715L) i białku S (D614G), które zwiększają zakaźność wirusa. Ostatnie badania wyraźnie wskazują, że z tymi wariantami związana jest również większa śmiertelność.

Analizy naukowe z Australii, analizy śledzenia kontaktów w Hong Kongu, Izraelu oraz statystyczne analizy danych WHO z początku epidemii wykonane w Wielkiej Brytanii wskazują na to, iż wirus rozprzestrzenia się niejednorodnie. Charakterystyczne jest tu zjawisko super roznosicieli, co oznacza, że 80% zakażeń powodowane jest przez jedynie 10% zakażonych osób. Taki sposób rozchodzenia się wirusa nazywamy niskim czynnikiem dyspersji. Nasza analiza danych genetycznych wirusów zsekwencjonowanych na świecie potwierdza tę hipotezę.