Bioinformatyka – biologia i informatyka

Bioinformatyka
Rys. 1. Podwójna helisa DNA.

Rys. 1. Podwójna helisa DNA.

Bioinformatyka 

Bioinformatyka jest jedną z najmłodszych nauk, której burzliwy rozwój został wymuszony przez postęp w dziedzinie nauk biologicznych, a umożliwiły go dokonane przełomowe osiągnięcia i wdrożenia w samej informatyce. [cyt.Błażewicz2011]

Wielu badaczy, mówiąc o bioinformatyce, ma na myśli głównie aspekty związane z biologią na poziomie molekularnym (DNA, RNA, białko). Stymulującym to odkryciem było podanie w 1953 r. przez Watsona i Cricka (razem ze współtwórcami Wilkinsem i Franklin nagrodzonymi w 1962 r. Noblem) modelu podwójnej helisy łańcucha DNA, przechowującego (kodującego) informację genetyczną we wszystkich organizmach żywych, co barwnie przedstawia jeden z autorów w swej powieści [Watson1975].

DNA człowieka

Ludzka nić DNA liczy ok. 3mld elementów, czyli cząstek kwasu dezoksyrybnukleinowego. Cząstka może mieć jedną z czterech wartości: G, T, C lub A. Ludzie różnią się układem cząstek w DNA i bardzo rzadko spotyka się identyczne łańcuchy(np. bliźnięta jednojajowe). Odczytanie tak długiego łańcucha jest bardzo kłopotliwe. Ponieważ łatwo jest odczytać krótkie łańcuchy, więc jedną z metod odcyfrowania DNA jest podzielenie łańcucha, ściślej wszystkich egzemplarzy łańcucha w roztworze, na mniejsze odcinki. Podziały dla poszczególnych łańcuchów różnią się i np. łańcuch: actacag może zostać podzielony na wiele różnych sposobów (a,ct,ac,ag),(ac,ta,cag),(ac,t,a,ca,g) które współistnieją w tym samym roztworze. Metoda polega na wczytaniu łańcuchów „jak leci” wprost do pamięci komputera, który zajmuje się ułożeniem łańcuchów do pierwotnego porządku. Jest to możliwe dzięki łączeniu łańcuchów „na zakładkę”, tak by długość ostatecznego łańcucha powstałego z połączenia wszystkich występujących w roztworze fragmentów była jak najmniejsza. 

Rys.2 Okładka powieści o odkryciu struktury DNA

Rys.2 Okładka powieści o odkryciu struktury DNA

W szerszym ujęciu problem przedstawiony w zadaniu polega na odczytaniu łańcucha o długości około 3 miliardów nukleotydów tworzonych przez jedną z czterech zasad: adeninę („A”), guaninę („G”), cytozynę („C”) i tyminę („T”).  Zarysowana metoda to jeden z komputerowo wspomaganych sposobów zwany „Sekwencjonowaniem przez hybrydyzację”. Szkic nie uwzględnia na przykład błędów jakie mogą powstać w trakcie odczytywania sekwencji polegających na pojawianiu się odczytów, którym nie odpowiadają żadne rzeczywiste sekwencje (tzw. błędy dodatnie) lub nieodczytywaniu sekwencji, które powinny być w roztworze (tzw. błędy ujemne). Sekwencjonowanie DNA ma dziś ogromne znaczenie w kryminalistyce, sądownictwie, rolnictwie, archeologii, farmaceutyce i medycynie.

Sekwencjonery

Przedstawiony na Rys.3 zminiaturyzowany sekwencjoner podłączony do komputera w kilka sekund sekwencjonuje genomy bakterii i wirusów. Dłużej zajmuje “rozkodowanie” bardziej złożonych genomów (6h dla człowieka). Zastosowanie może znaleźć nie tylko w medycynie, ale np. w archeologii. Konkurencja zapowiada maszynę radzącą sobie z ludzkim DNA w 2 godziny.

Zminiaturyzowany sekwencjoner DNA
Rys.3. Zminiaturyzowany sekwencjoner podłączany do komputera

Znaczenie DNA

Sekwencja DNA stanowi w pewnym sensie program działania mechanizmów w żywych komórkach, w szczególności pewne jej rejony określają jakie białko zostanie wytworzone a inne, w uproszczeniu, kiedy i gdzie (proces regulacji genów). Białka kodowane są za pomocą kodu genetycznego, w którym trójki zasad kodują pojedynczy aminokwas. Pojedyncze białko jest sekwencją aminokwasów, których standardowo wyróżniamy 20. Większość  aminokwasów może być zakodowana w DNA na kilka sposobów (kilka różnych trójek zasad koduje ten sam aminokwas). Sekwencje aminokwasów to inaczej łańcuchy polipeptydowe i mogą one przyjmować złożone struktury przestrzenne. Ustalenie biologicznie aktywnych struktur przestrzennych białek odpowiadających danej sekwencji aminokwasowej jest jednym z ciekawszych problemów z jakim boryka się biologia molekularna wspierana przez  tzw.”Bioinformatykę strukturalną”. Tutaj z pomocą przychodzą zaawansowane metody informatyczne tzw. uczenia maszynowego. Otóż znane z doświadczeń biologicznych pary: sekwencja aminokwasów i struktura białkowa są podawane na wejście programu uczącego się, który po pełnym cyklu uczenia powinien umieć prawidłowo wskazać strukturę dla zadanej sekwencji lub sekwencję dla zadanej struktury (np. przy projektowaniu leków). W chwili obecnej istnieją ogromne bazy danych gromadzące te odpowiedniki i używane w maszynowym uczeniu. Pomimo tego ciągle jeszcze nam daleko do perfekcyjnego prognozowania struktur białek.

Struktura 3D RNA
Rys.4. Struktura 3D RNA

Kierunek bioinformatyka

Ogólnie rzecz biorąc absolwent kierunku bioinformatyka wyższej uczelni powinien reprezentować wysoki poziom wiedzy biologicznej jak też wiedzy informatycznej w tym talentów programistycznych i posługiwania się systemami informatycznymi. W Poznaniu makrokierunek bioinformatyka jest prowadzony we współpracy Wydziału Biologii Uniwersytetu Adama Mickiewicza i Wydziału Informatyki Politechniki Poznańskiej. Na terenie Politechniki Poznańskiej działa Europejskie Centrum Bioinformatyki i Genomiki (ECBiG) jako unikalna na terenie Wielkopolski jednostka badawczo-rozwojowa, powstała na bazie konsorcjum zawiązanego pomiędzy Politechniką Poznańską a Instytutem Chemii Bioorganicznej PAN w Poznaniu.

Nieco żartobliwym zilustrowaniem tych działań jest animowany teledysk z piosenką o sekwencjonowaniu metodą hybrydyzacji DNA:

Alan w rytmie DNA from Mobit on Vimeo.

Literatura

[Błażewicz2011]J.Błażewicz „Bioinformatyka i jej perspektywy”,wykład inauguracyjny, Politechnika Poznańska, 2011 http://www2.cs.put.poznan.pl/wp-content/uploads/2011/11/wyklad_inauguracyjny_2011.pdf

[Watson1975]J. D. Watson „Podwójna spirala. Relacja naoczna o wykryciu struktury DNA”, Wiedza Powszechna,Seria: Omega,Warszawa,1975

[Tomala2018] Ludwika Tomala “RNA w 3D? Polacy zostawiają konkurencję w tyle!” https://naukawpolsce.pap.pl/aktualnosci/news%2C27837%2Crna-w-3d-polacy-zostawiaja-konkurencje-w-tyle.html, 2018.

Marcin Radom, “Kombinatoryczne aspekty nieklasycznego sekwencjonowania DNA przez hybrydyzację”, rozprawa doktorska, Poznań, 2011, https://www.cs.put.poznan.pl/mradom/papers/MRphdthesis.pdf

Zadanie do tego tekstu https://doktorb.it/odtwarzanie-dna/

Podziękowanie

Autor dziękuje panu Maciejowi Miłostanowi za konsultację treści.

Możesz również polubić…

1 Odpowiedź

  1. Fajnego masz bloga i ciekawe na nim treści czy na serwerze wszystko sie zmieści ? pięknie frazujesz słowa zmuszasz przy tym do myślenia tym komentarzem życzę powodzenia 🙂

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.

The maximum upload file size: 5 MB. You can upload: image, audio, video, document, spreadsheet, interactive, text, archive, code, other. Links to YouTube, Facebook, Twitter and other services inserted in the comment text will be automatically embedded. Drop file here