Technologie umożliwiające przeprowadzenie sekwencjonowania kwasów nukleinowych od wielu lat są prężnie rozwijane. Aktualnie producenci oferujący platformy umożliwiające sekwencjonowanie cząsteczek DNA prześcigają się w dostarczaniu coraz szybszych, tańszych i prostszych rozwiązań. W tym artykule opisujemy historię i metody sekwencjonowania DNA.
Sekwencjonowanie I generacji
Historia sekwencjonowania rozpoczęła się w 1953 roku, gdy James Watson i Francis Crick z pomocą badań krystalograficznych zaproponowali trójwymiarową strukturę helisy i DNA. Odtąd rozpoczęto intensywne starania mające na celu stworzenie metody umożliwiającej odczytanie kolejności nukleotydów w genomie. Pierwsze sukcesy pojawiły się w roku 1965, za sprawą Roberta Holley’a który zdołał odczytać kolejność nukleotydów w cząsteczce tRNA wyizolowanej z drożdży.
Wkrótce, w 1977 roku, nową metodę, która zawładnęła światem sekwencjonowania na ponad 30 lat, zaproponował Frederick Sanger opracowując technikę zwaną powszechnie metodą dideoksy lub po prostu metodą Sangera. Metoda Sangera opiera się na zastosowaniu zmodyfikowanych nukleotydów tzw. dideoksynukleotydów, których przyłączenie do nowo syntetyzowanej nici prowadzi do terminacji reakcji. Dodatkowo nukleotydy wyznakowane są za pomocą radioizotopów, a w analizie wykorzystuje się wysokorozdzielczą elektroforezę żelową. Ze względu na duże zainteresowanie sekwencjonowaniem, z czasem zaczęto usprawniać tę metodę umożliwiając automatyzację procesu wraz z opracowaniem stosowanej do dziś techniki opartej o zastosowanie nukleotydów znakowanych fluorescencyjnie w połączeniu z elektroforezą kapilarną i cyfrowym odczytem sygnału. Wprowadzenie powyższych udogodnień umożliwiło opracowanie pierwszego, komercyjnie dostępnego sekwenatora, zdolnego do sekwencjonowania fragmentów o długości sięgającej 1500 par zasad. Z pomocą sekwencjonowania pierwszej generacji w 2001 roku został rozpoczęty Human Genome Project, którego efektem było opracowanie pierwszego zarysu sekwencji ludzkiego genomu.
Sekwencjonowanie II generacji
Z upływem czasu rosnące zainteresowanie sekwencjonowaniem kwasów nukleinowych przyczyniło się do powstania i rozwoju technik sekwencjonowania wysokoprzepustowego. Umożliwiła tym samym jednoczesną analizę wielu próbek w jednej reakcji. Sekwencjonowanie nowej generacji – NGS (ang. next generations sequencing), pozwala uzyskiwać miliony odczytów w czasie nieporównywalnie krótszym niż w klasycznym sekwencjonowaniu metodą Sangera.
Wychodząc naprzeciw potrzebie zwiększenia przepustowości oraz znacznego skrócenia czasu przeprowadzania analizy opracowano szereg metod sekwencjonowania pozwalających ominąć żmudne etapy związane z klonowaniem fragmentów DNA. Zamiast tego w metodach sekwencjonowania zaliczanych do II generacji, do pofragmentowanego DNA bezpośrednio ligowane są sekwencje linkierowe lub adapterowe. Amplifikacja biblioteki odbywa się tu na specjalnie przygotowanych płytkach lub beadach, do których przytwierdzone są matrycowe fragmenty DNA. Przyłączenie nukleotydów monitorowane jest bezpośrednio przez pomiar luminescencji lub detekcję protonów. Opracowane rozwiązania umożliwiły wielkoskalowe sekwencjonowanie DNA i RNA przy rozsądnym nakładzie czasu pracy. Pomimo wysokiej rozdzielczości i jakości otrzymywanych sekwencji, istotnym ograniczeniem metod II generacji jest długość uzyskiwanego odczytu, nieprzekraczający kilkuset nukleotydów, co powoduje trudności w kolejnych etapach analizy sekwencji nukleotydowych jak choćby składanie de novo genomów, szczególnie w kontekście rejonów powtórzonych lub o niskiej złożoności.
Sekwencjonowanie III generacji
Sekwencjonowanie III generacji, określane jest mianem sekwencjonowania pojedynczych molekuł (cząsteczek kwasów nukleinowych). Pozwala na uzyskanie odczytów o długości znacznie większej niż technologie poprzednich generacji, przy jednoczesnej redukcji nakładów finansowych niezbędnych do przeprowadzenia analizy. Warto podkreślić, że sekwencjonowanie III generacji odbywa się w czasie rzeczywistym co pozwala również na znaczne przyspieszenie całego procesu sekwencjonowania.
Obecnie na rynku komercyjnym funkcjonują dwie platformy III generacji, które pozwalają na odczytywanie kolejności nukleotydów w pojedynczych cząsteczkach DNA i RNA: SMRT firmy PacBio oraz sekwencjonowanie nanoporowe firmy Oxford Nanopore Technologies. W teorii obie te metody sekwencjonowania pozwalają na otrzymanie odczytów o długości równej długości badanego fragmentu DNA. W praktyce jednak technologia SMRT najlepiej sprawdza się z fragmentami DNA pozwalającymi na uzyskanie odczytów o długości około 10 000 par zasad. Natomiast długość odczytów, uzyskanych w technologii stworzonej przez Oxford Nanopore wydaje się być nieograniczona, często sięgając od 300 000 do 500 000 par zasad, a rekordowe odczyty mogą mieć nawet 2 mln nukleotydów długości.