- Kierownik projektu: dr Bartosz Wilczyński
- Tytuł projektu: Atlas obszarów regulatorowych specyficznych dla mózgu ludzkiego - nowe narzędzie odkrywania ścieżek powodujących wybrane choroby mózgu
- Nazwa podmiotu: Uniwersytet Warszawski, Wydział Matematyki, Informatyki i Mechaniki; Instytut Biologii Doświadczalnej im. M. Nenckiego PAN; Instytut Podstaw Informatyki Polskiej Akademii Nauk
- Konkurs: SYMFONIA 3, ogłoszony 15 grudnia 2014 r.
Cel prowadzonych badań/hipoteza. O ekspresji genów w danej komórce, tkance lub sytuacji fizjologicznej decyduje kombinacja aktywnych czynników transkrypcyjnych, które wiążąc się z DNA w jego niekodującej części aktywują odpowiednie geny. Część kodująca stanowi niecałe 2% genomu, a instrukcje do regulacji ekspresji genów znajdują się w części niekodującej. W ramach projektu The Encyclopedia of DNA Elements (ENCODE) w niekodującym DNA scharakteryzowano regiony aktywnej transkrypcji, miejsca wiązania czynnikow transkrypcyjnych, strukturę chromatyny i modyfikacje epigenetyczne, przypisując funkcje biochemiczne obszarom niekodującym stanowiącym blisko 80% genomu człowieka. Badania te przyniosły bezprecedensowy postęp technologiczny i poszerzyły naszą wiedzę o funkcjonowaniu genomu i regulacji ekspresji genów. Ograniczenie tego podejścia wynika z faktu, że większość danych zebrano, wykorzystując linie unieśmiertelnione hodowane in vitro, często linie komórek nowotworowych, które nie odzwierciedlają realnych mechanizmów regulatorowych w prawidłowej komórce/tkance. Ze względu na niedostępność materiału z prawidłowego mózgu do badań wielkoskalowych regulacji ekspresji genów, obecnie nie ma informacji o obszarach regulatorowego DNA specyficznego dla mózgu, co ogranicza możliwości badawcze.
Dzięki zsekwencjonowaniu genomu człowieka możliwe stało się poszukiwanie zmian genetycznych występujących w genomie osób z chorobami neurologicznymi. W badaniach asocjacyjnych w skali całych genomów (GWAS) wykryto tysiące zmian genetycznych związanych z chorobami mózgu, co poszerzyło wiedzę o mechanizmach patologicznych, jednak znaczenie funkcjonalne zidentyfikowanych asocjacji jest słabo poznane lub niejasne, gdyż większość zmian wykrywanych przez GWAS (95%) okazuje się niekodującym DNA. O ile zmiany genetyczne występujące w części kodującej genomu są stosunkowo łatwe do wyjaśnienia, o tyle trudno jest przypisać znaczenie biologiczne zmianom/wariantom genetycznym występującym w części niekodującej. Porównanie mapy obszarów regulatorowych w genomie człowieka z mapami wariantów genetycznych GWAS w kilku chorobach (zapalenie jelit, rak jelita grubego, choroby serca) pokazało, że wiele zmian genetycznych występuje w obszarach niekodującego DNA, często w miejscach wiązania się czynników transkrypcyjnych z DNA. Celem tego interdyscyplinarnego projektu jest stworzenie wysokorozdzielczych map regulatorowego DNA w mózgu i odkrycie sieci regulacyjnych istotnych w patogenezie glejowych guzów mózgu oraz wykorzystanie opracowanego Atlasu i nowych metod obliczeniowych do lokalizacji zmian genetycznych odkrytych przez GWAS w chorobach psychicznych: schizofrenii i chorobie dwubiegunowej.
Zastosowana metoda badawcza/metodologia. Doświadczalna identyfikacja regulatorowego DNA w mózgu, analizy transkryptomu i epigenomu oraz poszukiwanie sieci regulacyjnych nie jest możliwe z powodu niedostępności materiału z prawidłowego mózgu. Proponujemy nowatorskie podejście polagające na stworzeniu wysokorozdzielczego Atlasu map regulatorowego DNA specyficznych dla mózgu w oparciu o dane publiczne, z ENCODE oraz pochodzące z tego projektu dane z analizy guzów mózgu (glejaków). Choć nie będzie to tkanka prawidłowa, nasze badania dostarczą wiarygodnego materiału do stworzenia Atlasu, gdyż: 1) usuwane chirurgicznie próbki glejaka zawierają duże fragmenty prawidłowej tkanki mózgowej (do 40%) oraz infiltrujące komórki układu odpornościowego; 2) glejaki wywodzą się ze stransformowanych nerwowych komórek macierzystych lub komórek progenitorowych, mogą więc reprezentować szerokie spektrum regulatorowego DNA specyficznego dla mózgu w różnych fazach rozwoju. Opracowanie Atlas miejsc regulatorowych sterujących ekpresją genów i odkrycie zmian genetycznych/wariantów w regulatorowym DNA pomoze znaleźć czynniki predykcyjne przeżywalności lub podatności pacjenta na chorobę.
W oparciu dane uzyskane w trakcie realizacji projektu, stosując zaawansowane i nowoopracowane metody informatyczne, skonstruujemy mapy i sieci interakcji potencjalnych obszarów regulatorowego DNA dla "chorego" mózgu. Wykorzystamy metody informatyczne do wyszukiwania cech i budowania sieci zależności. Wykorzystując zgromadzone dane, zbadamy sieci regulacyjne genów i wytypujemy obszary regulatorowego DNA, w którym będziemy poszukiwać wariantów powiązanych z patogenezą psychoz i zidentyfikowane w badaniach przesiewowych GWAS.
Tak szeroki projekt jest ogromnym wyzwaniem i jego realizacja wymaga współpracy specjalistów z różnych dziedzin: psychiatrii, neurochirurgii, biologii molekularnej, bioinformatyki i statystyki, a także informatyki. Ze względu na konieczność przechowywania i obróbki ogromnej liczby danych, także w kontekście pozyskiwania publicznych danych ENCODE i genomowych baz danych niezbędna jest współpraca specjalistów z wielu dziedzin. Partnerzy konsorcjum owocnie współpracowali wcześniej ze sobą, o czym świadczą opublikowane przez nich prace.
Wpływ spodziewanych rezultatów na rozwój nauki, cywilizacji, społeczeństwa. Wyniki badań przyczynią się do odkrycia podstawowych mechanizmów kluczowych dla patogenezy glejaków oraz wyjaśnią dysfunkcje sieci kontrolujących regulację ekspresji genów i powiązań epigenetycznych w tych procesach. Dodatkowo wykorzystanie map regulatorowego DNA pozwoli przypisać znaczenie biologiczne zidentyfikowanym przez GWAS zmianom genetycznym skojarzonym z głównymi psychozami, rzucając nowe światło na patogeneze tych chorob. Rezultaty mogą też wskazać nowe podejście do diagnostyki glejaków oraz psychoz lub nowe cele terapeutyczne. W wyniku projektu powstaną wysokiej jakości publikacje oraz 4 rozprawy doktorskie. Realizacja projektu wymaga intensywnej współpracy międzydziedzinowej i wypracowania nowych metod analizy w skali całych genomów.