Да прочетеш непрочетимото – как разчетоха човешкия геном

Post Syndicated from original https://www.toest.bg/da-prochetesh-neprochetimoto-kak-razchetoha-choveshkiya-genom/

Двойната спирала

Да прочетеш непрочетимото – как разчетоха човешкия геном

Всички са чували за ДНК, или двойната спирала. Но какво всъщност се крие в тази структура, наподобяваща спираловидното стълбище към кабинета на професор Дъмбълдор в магическото училище „Хогуортс“? ДНК съдържа пълните инструкции за развитието на една клетка, тъкан, орган. Звучи почти като фантастика, но дезоксирибонуклеиновата киселина има 521 години полуживот, което означава, че половината ДНК от една проба деградира за тези 521 години.

ДНК в една клетка в „разплетено“ състояние (подобно на развито кълбо прежда) е дълга два метра. За да се събере цялата тази информация, тя е в компактно състояние, наречено хромозома. Хромозомата е „кълбо от прежда“, което се развива само при нужда, тоест тя променя компактното си състояние само ако даден ген е активен и е на път да се превърне в РНК и оттам в белтък.

В центъра на всички човешки клетки (ядрото) има 46 броя хромозоми (две двойки по 23 – диплоиден набор). Понятието „геном“ включва всъщност точно тези 23 хромозоми (хаплоиден набор). Единствените клетки с 23 хромозоми са половите (яйцеклетки и сперматозоиди), тъй като след сливането им се осигурява диплоидният набор и генетичното разнообразие.

Проектът за човешкия геном

Преди 70 години учените са установили структурата на ДНК. Тя е изградена от нуклеотиди, които са съставени от азотни бази, захар, наречена дезоксирибоза, и фосфатна група. Макар през 1963 г. Джеймс Уотсън, Франсис Крик и Морис Уилкинс да печелят Нобелова награда за откритието си, няма как да не се отбележи, че редица други учени са участвали в процеса и имат не по-малки заслуги: органичният химик Александър Тод, биохимикът Ървин Чаргаф, биофизикът Розалинд Франклин и физикохимикът Лайнъс Полинг.

Проектът за човешкия геном (1990–2003) е смятан за най-важното биомедицинско проучване на ХХ век. Освен самите научни постижения, той е от изключителна значимост, защото дава начало на идеята за публично споделяне на научните данни и разглежда въпроса за етиката при биомедицинските изследвания. Друга отличителна черта на проекта е, че учените изследват неизвестното в биологичния свят, а не както по принцип се провежда една научна разработка – с изказване на научна хипотеза/теория и последващото ѝ приемане или отхвърляне.

Проектът е интернационален и целта му е била да се секвенира (разчете) целият човешки геном, както и геномът на няколко други организъма (бактерията Escherichia coli, дрождите, винената мушица и мишките). Целите на проекта и начертаният план са се променяли в хода им и е интересно да се отбележи, че той е приключил цели две години по-рано от планираното, надминавайки очакванията и представите на учените, които са обмисляли идеята още през 1988 г.

Какво представлява разчитането на един геном?

Геномът е изграден от определени последователности (секвенции), подобно на книга, състояща се от изречения, изградени от думи, а думите – от букви. Секвенирането на ДНК представлява определянето на подредбата на азотните бази, които я изграждат. Това са аденин (А), цитозин (Ц), гуанин (Г) и тимин (Т). Голяма част от усилията на участниците в Проекта за човешкия геном са насочени именно към развитието на технологиите, разчитащи генома (т.нар. секвенатори).

Разчетеният човешки геном не е само на един човек. В проекта са участвали анонимни доброволци, подписали информирано съгласие за използване на техния генетичен материал (кръвна проба) за научни изследвания.

Проектът е публично финансиран, като първоначалните средства за обезпечаването му са възлизали на 3 млрд. долара за планирания 15-годишен период. Изразходваната сума трудно може да се изчисли с точност, тъй като участниците са от 20 университета от САЩ, Великобритания, Франция, Германия, Япония и Китай, но се смята, че е близка до първоначално заложената. Въпреки огромната сума, постигнатите резултати със сигурност си заслужават отделените средства, време и труд. Икономическите ползи от развитието на геномиката, като например напредъкът във фармацевтичната и биотехнологичната индустрия, са за поколения напред.

Един от най-интересните аспекти на проекта са т.нар. Бермудски принципи. След две срещи на учените от проекта в Бермуда е взето решение всеки разчетен участък от генома да бъде почти веднага публично достъпен. Това решение за прозрачност и информираност при споделянето на данни от биомедицински изследвания е безценно.

Въпреки многогодишната работа и неоспоримите ползи от Проекта за човешкия геном, всъщност нашият геном не е разчетен напълно при приключването на първоначалната работа през 2003 г. Геномът ни носи информация за производството на РНК и белтъци в участъци, известни като екзони, но той е изграден и от интрони. Доскоро се смяташе, че интроните не кодират никаква информация и са излишни и непотребни (т.нар. junk DNA). ДНК съдържа и по-комплексни и често повтарящи се участъци, които затрудняват разчитането ѝ.

През 2000 г. Консорциумът за секвениране на човешкия геном съобщава, че геномът ни е 90% разчетен, но с цели 150 000 неизвестни области от ДНК, познати като „празнини“. През 2003 г. Консорциумът съобщава за подобрения в разчитането на генома и почти пълното му завършване – 92%, с 400 останали празнини.

През 2013 и 2019 г. Консорциумът за референтен геном добавя поправки и подобрения към публично наличната информация за разчетения геном.

Разшифроване на последните 8 процента от човешкия геном

На 31 март 2022 г. консорциумът „От теломер до теломер“ съобщава, че е запълнил останалите празнини и напълно завършеният човешки геном вече е факт. Полученият пълен геном (означаван като T2T-CHM13) вдига 20-годишната бариера, която ни е делила от оставащите 8%. Те включват всички центромерни райони на хромозомите (структура, която играе основна роля при разделянето на ДНК по време на деленето на клетката) и целите къси рамена на 5 хромозоми (13-та, 14-та, 15-та, 21-ва и 22-ра).

Късите рамена на тези хромозоми се състоят от хиляди повторения и гените носят информация за производството на т.нар. рибозоми. Рибозомите са структури от изключително важно значение, тъй като те изграждат всички белтъци, необходими за функционирането на една клетка. Високото ниво на генетични вариации в центромерите е златна мина, която тепърва ще се копае, за да се установи функционалното им значение.

Учените съобщават, че са добавили около 200 млн. ДНК бази. Всичко това не би било възможно без разработването и внедряването на най-новите секвенатори на Oxford Nanopore и Pacific Biosciences. Секвенаторите са машини, които четат азотните бази от ДНК (А, Г, Ц и Т), и след това софтуер ги подрежда. ДНК се изолира от генетичния материал (например кръв), след това се подготвя т.нар. ДНК библиотека. Секвенаторът не може да чете цялата ДНК, защото е прекалено дълга. Затова тя се накъсва (фрагментира), маркират се краищата на всеки фрагмент и след като секвенаторът ги прочете, софтуерът ги подрежда. Новата технология за секвениране позволява разчитането на по-дълги участъци с точност над 99%.

Следващата стъпка

Наличното пълно разчитане на човешкия геном е предпоставка за установяването на още гени, предразполагащи към определени заболявания. Общият поглед над целия геном без празнини или „скрита“ ДНК ще даде възможност на учените да изяснят множество въпросителни относно човешкото здраве и еволюция.

Въпреки че CHM13 представлява пълният геном, той не обхваща целия спектър от генетичните вариации при човека. Поради тази причина консорциумът „От теломер до теломер“ вече е обединил силите си с Консорциума на човешкия референтен пангеном с цел събирането на висококачествени референтни геноми от разнообразни проби.

Персонализираната медицина днес и в близкото бъдеще

Анализът на огромната информация от индивидуалните различия на гените позволява създаването на персонализираната (прецизна) медицина. Морето от информация, известно като Big Data, се анализира с алгоритми, основаващи се на машинно обучение. Приложението им в персонализираната медицина ще помогне за разработването на нови лекарства за терапия на генетични заболявания.

Напредъкът в машинното обучение, като изкуствения интелект и дълбокото обучение, са част от кутията с инструменти, подготвяна за предстоящите изследвания на геномната информация. Прогресът в тези области е неотменна част от иновациите, които тепърва предстоят в областта на персонализираната медицина.

Заглавно изображение: Кариограма на човек (хромозомите, подредени по размер, вид и брой). Източник: Wikimedia Commons