Текст книги "Замысел. Как ДНК делает нас теми, кто мы есть"
Автор книги: Роберт Пломин
сообщить о нарушении
Текущая страница: 11 (всего у книги 20 страниц)
Например, SNP, связанные с ожирением, не являются SNP для диагностики ожирения. Они связаны с индексом массы тела (ИМТ) по всему распределению, от худощавых до полных людей, как мы видели для FTO SNP. Другими словами, эти SNP, связанные с ИМТ, делают худого человека немного тяжелее так же, как они делают человека с избыточным весом немного тяжелее. У всех нас есть много аллелей SNP, которые влияют на ИМТ. Избыточный вес зависит от того, сколько у вас этих аллелей. Ожирение не является качественным расстройством; это вопрос более или менее. Именно это имеется в виду, когда говорят, что сложные расстройства являются количественными признаками, даже для тяжелых психологических расстройств, таких как шизофрения, биполярное расстройство и аутизм. По этой причине полигенные оценки будут способствовать тому, чтобы психология отошла от категориальных диагнозов к непрерывным измерениям, оцениваемым с использованием стандартизированных размерных рейтинговых шкал симптомов, что, как мы увидим, является одним из важных следствий революции ДНК.
Еще одно огромное преимущество обучения измерения, а не расстройства, заключается в том, что один и тот же образец можно использовать для изучения многих признаков, в то время как образцы, отобранные для конкретного расстройства, полезны только для изучения этого расстройства. Во многих странах были созданы биобанки с размерами выборки в сотни тысяч человек, которые собрали широкий спектр психологической, а также медицинской информации. Например, UK Biobank, основанный в 2006 году и финансируемый британскими благотворительными организациями и британским правительством, включает полмиллиона добровольцев, которые предоставили ДНК и доступ к своим медицинским записям и выполнили множество мероприятий, включая измерения психологических параметров. Аналогичные проекты осуществляются и в других странах, в том числе в Эстонии, Нидерландах и странах Скандинавии. Недавно Финляндия объявила о создании биобанка, в котором будут собирать ДНК более 1 миллиона человек.
За последние два года произошел всплеск успешных исследований GWA психологических аспектов. Первый прорыв был для маловероятная переменная: годы образования. В развитых странах наследуемость лет обучения составляет 50 процентов. Этой наследственности способствуют многие психологические черты , такие как предыдущие достижения в школе и когнитивные способности, которые коррелируют 0,5 с годами обучения. На разные годы обучения также влияют такие черты личности, как настойчивость и добросовестность, а также психическое здоровье, например отсутствие изнурительной депрессии.
Причина его успеха GWA заключается в том, что в него была включена выборка из более чем миллиона человек, что является крупнейшим исследованием GWA на сегодняшний день. Эта большая выборка позволила выделить крошечные ассоциации SNP, которые окупились за счет идентификации более тысячи значимых ассоциаций по всему геному. Как и для всех других сложных характеристик, величина эффекта для лет обучения невероятно мала – наибольший эффект составил всего 0,03%, а средний размер эффекта лучших SNP – 0,02%, что соответствует всего лишь двум неделям обучения. Однако, как я объясню позже, агрегирование этих SNP может предсказать более 10% дисперсии в годах обучения. Это делает ДНК лучшим предсказателем количества лет обучения ребенка, который у нас есть, даже лучше, чем влияние окружающей среды на социально-экономический статус семьи. Этот успех сигнализирует о начале ДНК-революции в психологии.
Исследования GWA по другим психологическим измерениям также были успешными, поскольку размеры их выборки стали достаточно большими, чтобы выявить множество небольших ассоциаций SNP, ответственных за наследуемость. Что касается интеллекта, исследования GWA имели лишь скромный успех, пока размер выборки не достиг почти 300 000, когда в 2018 году было зарегистрировано более 200 значимых ассоциаций. Предыдущие исследования, включая мое, не имели возможности обнаружить эти небольшие ассоциации.
Сообщалось о десятках исследований GWA для конкретных способностей, таких как чтение и математика, но размеры их выборки были слишком малы, чтобы найти много надежных ассоциаций. Эта ситуация скоро изменится, поскольку будут создаваться крупномасштабные консорциумы, например, для чтения, а некоторые из крупных биобанков будут включать в себя измерения конкретных способностей.
Охота за генами также начинает приносить успех в отношении личности, поскольку размер выборки исследований личности GWA увеличился. Поскольку исследования личности основаны на анкетах для самоотчетов, было легче получить большие выборки для личности, чем для когнитивных способностей, которые требуют проведения тестов. Первые успехи были достигнуты в исследованиях GWA двух основных аспектов личности, экстраверсии и невротизма, которые, как показывают исследования близнецов, наследуются примерно на 40 процентов. Экстраверсия включает общительность, импульсивность и живость. Нейротизм, который относится к эмоциональной нестабильности, а не к невротизму, включает капризность, беспокойство и раздражительность. Для экстраверсия, исследование GWA с участием 100 000 человек обнаружило 5 совпадений. Что касается невротизма, то в исследовании GWA с размером выборки 300 000 было зарегистрировано более 100 попаданий . Новым направлением исследований личности является чувство благополучия , в основном счастья, которое показывает аналогичную 40-процентную наследуемость в исследованиях близнецов. В исследование GWA почти 200 000 человек, было обнаружено 3 совпадения.
исследования GWA других интересных проявляются личностные черты. Многие из них взяты из британского биобанка с полумиллионной выборкой. Сообщалось о значительных изменениях таких характеристик, как потребление кофе и чая, хронические нарушения сна (бессонница), усталость и даже то, является ли человек жаворонком или ночным человеком. Другим недавним примером является черта, называемая когнитивной эмпатией, которая включает в себя обнаружение эмоций только по фотографиям глаз.
Это только начало ДНК-революции. К тому времени, когда вы будете это читать, будут проведены десятки более крупных и качественных исследований GWA этих и многих других характеристик. Важным источником новой информации станет крупнейшая компания, специализирующаяся на геномике, ориентированная на потребителей, 23andMe, у которой почти 2 миллиона платных клиентов. Восемьдесят процентов его клиентов согласились на использование их генотипов в исследованиях и на рассмотрение последующих запросов на исследования. Средний клиент участвует в более чем 200 кратких исследованиях, многие из которых являются психологическими исследованиями.
Самое шокирующее открытие за два десятилетия охоты за генами заключается в том, что вместо охоты на крупную дичь настоящей добычей являются микроскопические существа. Величина эффекта различий ДНК, ответственных за наследуемость всех психологических расстройств и размеров, намного меньше, чем кто-либо ожидал. То есть двадцать пять лет назад все, кто охотился за генами, предполагали, что горстка генов объясняет большую часть наследуемости, наблюдаемой в исследованиях близнецов. Как отмечалось ранее, всего десять генов, каждый из которых отвечает за 5 % дисперсии, объясняют 50-процентную наследуемость.
Результаты GWA говорят совсем о другом. Для сложных признаков не было найдено ни одного гена, который бы объяснял 5% дисперсии, даже 0,5% дисперсии. Средние размеры эффекта составляют порядка 0,01 % дисперсии, а это означает, что для учета наследуемости в 50 % потребуются тысячи ассоциаций SNP.
Стратегия грубой силы все больших выборок для обнаружения все меньших эффектов окупилась, так что теперь у нас есть тысячи SNP, связанных со сложными психологическими чертами. Новые усовершенствования в быстро развивающейся науке генетики увеличат улов. Определенный импульс даст генотипирование всех различий ДНК, а не только тех, которые в настоящее время находятся на чипах SNP. Чипы SNP, используемые в исследованиях GWA, основаны на общих SNP, частота аллелей которых превышает 1 процент в популяции, тогда как подавляющее большинство различий ДНК в геноме встречаются гораздо реже, чем 1 процент. Многие унаследованные различия ДНК уникальны для человека.
Эти различия ДНК могут быть генотипированы с помощью полногеномного секвенирования, которое секвенирует все 3 миллиарда пар оснований ДНК. Полногеномное секвенирование – следующее большое достижение в геномике. Это конец истории в том смысле, что последовательность из 3 миллиардов пар оснований ДНК – это все, что мы наследуем. Это означает, что унаследованные различия ДНК, ответственные за наследуемость, должны где-то существовать.
Полногеномные последовательности уже получены для сотен тысяч особей. Было предсказано, что в ближайшие несколько лет у миллиарда людей будет секвенирован весь их геном, и эта информация ДНК будет связана с электронными медицинскими записями. Мы уже знаем, что существует избыток редких мутаций у людей с шизофренией, аутизмом и умственной отсталостью, и что у людей с чрезвычайно высоким интеллектом этих редких мутаций меньше, что позволяет предположить, что редкие мутации вредны для вас.
Без сомнения, многое можно узнать из секвенирования 3 миллиардов пар оснований ДНК. Можно с уверенностью сказать, что, оглядываясь через десять лет, мы поймем, как мало мы знали о том, как найти различия в ДНК, которые влияют на психологические черты. Это новое знание повысит нашу способность находить больше унаследованных различий ДНК, которые ответственны за наследуемость психологических черт.
Теперь, когда вы прочитали эту сагу, показывающую необходимость все больших и больших исследований GWA для обнаружения все меньших и меньших ассоциаций SNP, было бы разумно спросить, зачем беспокоиться? Есть две причины для поиска унаследованных различий ДНК, лежащих в основе индивидуальных различий психологических черт. Первый – найти пути от генов к мозгу и поведению, а второй – предсказать поведение.
Что хорошего в таких маленьких эффектах? Ответ «не так много», если вы молекулярный биолог, желающий изучить пути от генов к мозгу и поведению, или если вы работаете в фармацевтической промышленности и хотите найти лекарство для исправления сломанного гена. Такие небольшие эффекты создают сумбур крошечных путей, которые трудно отследить. Определить механизмы, лежащие в основе ассоциаций SNP, будет сложно, потому что их эффекты очень малы, в среднем около 0,01%.
Еще больше усложняет этот восходящий подход от ДНК к поведению плейотропия, которая, как мы видели, означает, что любое различие в ДНК влияет на многие черты. Плейотропия гарантирует, что нет четкого пути от генов к мозгу и поведению. Пути блуждают по всему мозгу. Например, FTO SNP не следует прямому пути через мозг, чтобы повлиять на наше пищевое поведение. Хотя ген FTO наиболее известен своим влиянием на жировые клетки, он сильно экспрессируется по всему мозгу, особенно в коре головного мозга, которая играет центральную роль во всех когнитивных процессах. Эти перипатетические эффекты не являются специфическими для гена FTO – большинство генов влияют на большинство мозговых и поведенческих процессов . Если каждый ген влияет на многие виды поведения, это означает, что на каждое поведение будут влиять многие гены, что и показали исследования GWA.
Другая причина, по которой восходящий подход от генов к поведению будет затруднен, заключается в том, что большинство ассоциаций SNP с психологическими чертами не связаны с генами в традиционном смысле. Подавляющее большинство ассоциаций SNP было обнаружено в некодирующих областях генома. Мало что известно об этой «темной материи» ДНК – 98% ДНК не кодирует белки. Что мы знаем до сих пор, так это то, что некодирующие области могут участвовать в регуляции экспрессии генов.
В отличие от плана игры «снизу вверх» биологов, психологи используют подход «сверху вниз». Для биологов конечной целью генетики является понимание всех путей между унаследованными различиями в ДНК и индивидуальными различиями в поведенческих чертах, восходящий подход. Однако психологи сосредотачиваются на поведении и используют генетику для понимания поведения. Эта нисходящая психологическая перспектива начинается с предсказания. Мы можем использовать унаследованные различия ДНК, чтобы предсказать индивидуальные различия в психологических чертах, ничего не зная о бесчисленных путях, связывающих гены и поведение.
Проблема в том, что различия в ДНК, оказывающие такое незначительное влияние, кажутся бесполезными для предсказания. Десять лет назад, когда пришло осознание того, что
самые большие ассоциации крайне малы, у меня возникла мысль, которая скрасила для меня картину. Хотя эффекты отдельных SNP ничтожны, эти эффекты можно добавить, как мы добавляем элементы в тесте, чтобы создать составную оценку. В 2005 году я назвал эти наборы SNP . В настоящее время существует по крайней мере дюжина названий для этих составных оценок, но обычно их называют полигенными оценками .
Мысль о таком количестве SNP с такими небольшими эффектами была большим скачком по сравнению с тем, с чего мы начали двадцать пять лет назад. Теперь мы точно знаем, что наследуемость вызывается тысячами ассоциаций с невероятно малым эффектом. Тем не менее, объединение этих ассоциаций в полигенные оценки, объединяющие эффекты десятков тысяч SNP, позволяет прогнозировать такие психологические черты, как депрессия, шизофрения и успеваемость в школе.
12
Гадалка по ДНК
Уже несколько десятилетий известно, что наследуемость психологических расстройств и параметров обусловлена многими различиями в ДНК, а не только одним или двумя генами, которые наносят большой удар. Шоком от полногеномных ассоциативных исследований стало осознание того, что означает «много» – не несколько десятков различий ДНК, а десятки тысяч. Исследования GWA показали, что не существует ассоциаций, объясняющих более 1% различий между людьми, и что средний размер эффекта составляет менее 0,01%. Это означает, что тысячи различий ДНК вносят вклад в наследуемость психологических черт, и что для обнаружения этих крошечных ассоциаций необходимы огромные выборки GWA.
После фальстарта исследований генов-кандидатов, которые не удалось воспроизвести, исследование GWA установило строгий критерий для сообщения о статистически значимых «попаданиях» путем исправления ассоциаций для миллиона тестов по всему геному. Этот критерий упускает из виду множество ассоциаций, которые не достигают и не могут достичь статистической значимости, поскольку их влияние очень мало. Какими бы крошечными ни были эти эффекты, их можно объединить для создания составной или полигенной оценки. Хотя незначительные эффекты отдельных SNP бесполезны для предсказания, полигенные оценки, которые объединяют эти эффекты, независимо от того, насколько они малы, могут сильно предсказывать генетические склонности. «Полигенность» – это то, что делает эти оценки способными предсказать индивидуальные различия в психологии. Другими словами, ключевым критерием исследования GWA является не то, сколько ассоциаций достигает статистической значимости. Гораздо важнее способность полигенной оценки, полученной по результатам исследования GWA, предсказывать индивидуальные различия.
Полигенные оценки, основанные на ДНК, а не на хрустальных шарах, являются предсказателями. Как мы увидим, предсказание имеет решающее значение, поскольку оно является ключом к предотвращению психологических проблем и поощрению обещаний. Это новый мир личной геномики, который начинается со способности использовать унаследованные различия ДНК в геноме для предсказания психологических различий. Что касается психологических аспектов и расстройств, некоторые полигенные шкалы уже достигли впечатляющего уровня предсказательной силы. В этой главе показано, что такое полигенная оценка, и описаны возможности полигенных оценок, созданных за последние два года. Он раскрывает некоторые из моих собственных полигенных оценок, чтобы заглянуть в будущее психологической личной геномики.
Поскольку полигенные оценки являются основой ДНК-революции в психологии, важно понять, что они из себя представляют. Полигенная оценка похожа на любую составную оценку, которую психологи обычно используют для создания шкал из элементов, например, из личностного опросника. Цель полигенной оценки – предоставить единый генетический индекс для прогнозирования черты, будь то шизофрения, благополучие или интеллект. Чтобы получить конкретное представление о полигенной оценке, рассмотрим такую черту личности, как застенчивость. Анкета для оценки застенчивости включает в себя несколько пунктов, чтобы задействовать различные аспекты застенчивости. Например, в типичной анкете о застенчивости будут пункты о том, насколько вы тревожны в социальных ситуациях и насколько вы избегаете этих ситуаций – например, походов на вечеринки, встречи с незнакомцами и выступлений на собрании. Вас могут попросить ответить по трехбалльной шкале (0 = никогда, 1 = иногда, 2 = часто).
Оценка застенчивости создается путем добавления этих элементов, стараясь «перевернуть» элементы по мере необходимости, чтобы высокий балл означал высокую степень застенчивости. Если бы наша мера застенчивости состояла из десяти элементов, получивших 0, 1 и 2 балла, общее количество баллов могло бы варьироваться от 0 до 20. Простое добавление таких элементов рассматривает каждый элемент как одинаково полезный, но не все элементы одинаково полезны. По этой причине элементы часто добавляются после того, как они взвешиваются по какому-либо критерию их полезности для отражения конструкта застенчивости.
Точно так же создаются полигенные оценки, за исключением того, что вместо пунктов в вопроснике мы суммируем генотипы SNP. Как трехбалльная шкала оценки застенчивости, Генотипы SNP подсчитываются как 0, 1 или 2, что указывает на количество «возрастающих» аллелей, как в примере FTO SNP. Точно так же, как мы можем сложить аллели для одного SNP, чтобы получить генотипическую оценку, мы можем также сложить аллели для многих SNP, чтобы создать полигенную оценку, точно так же, как мы добавляем элементы анкеты, чтобы получить оценку застенчивости. Результаты полногеномных ассоциативных исследований используются для выбора SNP и присвоения веса каждому SNP. Например, в анализе веса GWA SNP FTO учитывает гораздо большую дисперсию, чем другие SNP, поэтому он должен учитывать гораздо больше в полигенной оценке веса .
В следующей таблице показано, как полигенная оценка одного человека создается из десяти SNP. Для первого SNP генотип этого человека – AT.
Для этого SNP аллель Т оказывается возрастающим аллелем, положительно связанным с признаком. Таким образом, индивидуальный генотипический показатель для этого SNP равен 1, потому что генотип имеет только один возрастающий Т-аллель.
По десяти SNP у индивидуума в общей сложности девять возрастающих аллелей для признака из возможных 20 баллов. Таким образом, этот индивидуум будет иметь полигенный балл чуть ниже среднего балла по популяции, равного 10 для этого признака.
Эта оценка просто добавляет количество увеличивающихся аллелей, что достаточно хорошо работает в качестве полигенной оценки. Однако мы можем повысить его точность, взвесив генотипическую оценку для каждого SNP в зависимости от того, насколько SNP коррелирует с признаком. Корреляция между каждым SNP и признаком взята из анализа GWA. Если один SNP в пять раз больше коррелирует с признаком, чем другой SNP – например, SNP 1 по сравнению с SNP 10 – он должен учитываться в пять раз больше в полигенной шкале.
Возрастающий аллель
Аллель
1
Аллель 2
Генотипическая оценка
Корреляция с чертой
Взвешенная генотипическая оценка
СНП 1
Т
А
Т
1
0,005
0,005
СНиП 2
с
г
г
0
0,004
.000
СНП 3
А
А
А
2
0,003
0,006
СНП 4
г
г
г
1
0,003
0,003
СНП 5
г
С
с
0
0,003
.000
СНП 6
Т
А
Т
1
0,002
0,002
СНП 7
С
С
г
1
0,002
0,002
СНП 8
А
А
А
2
0,002
0,004
СНП 9
А
Т
р
()
0,001
.000
СНП 10
г
С
г
1
0,001
0,001
Полигенная оценка
9
0,023
Таблица 3 Оценка полигенности для одного человека на основе десяти SNP
Взвешенные генотипические баллы в последнем столбце таблицы представляют собой произведение генотипического балла для каждого SNP и корреляции с признаком.
Сумма этих взвешенных генотипических оценок для десяти SNP равна
0,023. Это число не так поддается интерпретации, как невзвешенная генотипическая оценка 9, которая представляет собой просто сумму «возрастающих» аллелей. Однако как невзвешенная полигенная оценка 9, так и взвешенная оценка 0,023 могут быть выражены просто как процентиль в популяции. Для этого человека оба типа указывают на полигенность чуть ниже среднего.
Сколько SNP должно войти в полигенную оценку ? Первоначально полигенные оценки были созданы с использованием только значимых «попаданий» для всего генома из исследования GWA. Что касается веса, девяносто семь независимых SNP достигли общегеномной значимости. Создание полигенной оценки из этих девяноста семи SNP объясняет 1,2% дисперсии веса в независимых выборках. Это лишь немногим лучше, чем прогноз самого FTO SNP, который объясняет 0,7% дисперсии.
Использование только значимых совпадений для всего генома – это то же самое, что требовать, чтобы каждый элемент нашей шкалы застенчивости сам по себе был значительным предсказателем. Мы не делаем этого для других психологических оценок, потому что нереально ожидать, что каждый пункт будет стоять сам по себе. Цель состоит в том, чтобы максимально использовать составную шкалу.
Идея получше состоит в том, чтобы делать то, что мы делаем, когда создаем другие психологические оценки: продолжайте добавлять пункты, пока они повышают надежность и достоверность композита в независимых выборках. Для полигенных оценок ключевым критерием является предсказание. Новый подход к полигенным показателям состоит в том, чтобы продолжать добавлять SNP до тех пор, пока они увеличивают прогностическую способность полигенного показателя в независимых выборках. Это стратегия, которая за последние два года окупилась благодаря получению мощных полигенных оценок психологических черт. Некоторые ложноположительные результаты будут включены в полигенную оценку, но это приемлемо, пока сигнал увеличивается по сравнению с шумом в том смысле, что полигенная оценка предсказывает большую дисперсию.
Например, для ИМТ полигенная оценка, основанная на девяносто семи значимых для всего генома SNP, предсказывает 1 процент дисперсии, а полигенная оценка, включающая 2000 SNP, предсказывает 4 процента дисперсии ИМТ. Включение еще большего количества SNP в полигенную оценку увеличивает прогноз до 6 процентов дисперсии. Многие ложноположительные SNP проникают в эту полигенную оценку, но они не портят прогноз, они просто не помогают. Увеличение прогностической способности полигенной оценки с 1% до 6% делает это очень приемлемым компромиссом между сигналом и шумом.
Для сложных признаков и распространенных расстройств этот новый подход к полигенным показателям включает не только десять, сотню или даже тысячу SNP. Как правило, в полигенные баллы включаются десятки тысяч SNP, иногда сотни тысяч. Это эмпирический метод – продолжайте добавлять SNP до тех пор, пока они увеличивают способность прогнозировать в независимых выборках.
Сводная статистика GWA, необходимая для создания полигенных оценок, в настоящее время доступна для сотен признаков в области биологии и медицины, а также психологии. После публикации исследования GWA многие исследователи делают свои сводные статистические данные GWA общедоступными, чтобы любой мог использовать их для создания полигенных оценок. Чтобы дать представление о взрывном росте исследований GWA за последнее десятилетие, основное хранилище этих результатов включает сводную статистику GWA для 173 признаков, основанную на 1,5 миллионах человек и 1,4 миллиардах ассоциаций SNP-признаков. Эти черты включают двадцать психологических черт и расстройств и переменных, имеющих отношение к психологии, таких как социальная депривация, курение, продолжительность сна, возраст наступления менархе и менопаузы и возраст смерти отца. Они также включают физиологические черты, имеющие отношение к психологии, такие как иммунологические и метаболические биомаркеры.
Нельзя не отметить, что это только начало эры полигенных партитур. Хотя сводная статистика GWA общедоступна для более чем 200 признаков, анализы GWA были зарегистрированы для сотен других признаков, которые в конечном итоге будут добавлены в список возможных оценок полигенности по мере того, как их сводная статистика станет доступной. Кроме того, более крупные и качественные исследования GWA будут постоянно давать более мощные полигенные оценки для всех признаков.
В оставшейся части этой главы я поделюсь своими полигенными показателями роста и веса, чтобы исследовать некоторые общие вопросы, связанные с этими показателями. Они дают конкретные иллюстрации того, как полигенные оценки предвещают эру личной геномики в психологии. При создании моих полигенных оценок мы использовали самые последние опубликованные исследования GWA, описанные в предыдущей главе, хотя в каждом случае в работе находится анализ GWA гораздо более крупных выборок. К тому времени, когда вы будете это читать, следующая оценка будет консервативной оценкой мощности полигенных оценок.
Полигенные оценки требуют ДНК, полногеномного генотипирования и большого количества анализов. Менее чем за 100 фунтов стерлингов компании, работающие непосредственно с потребителем, извлекут вашу ДНК из слюны и проведут полногеномное генотипирование с использованием SNP-чипов. Эти компании сосредоточились на нарушениях одного гена, но одно и то же полногеномное генотипирование можно использовать для создания полигенных показателей. Компании начинают повторно анализировать данные о генотипах SNP, чтобы предоставить широкой публике оценки полигенности. Одни и те же генотипы SNP можно использовать для создания полигенных оценок для любого признака, для которого доступны результаты GWA.
Чтобы проиллюстрировать полигенное предсказание с помощью моей собственной ДНК, необходима большая сравнительная выборка с аналогичными построенными полигенными баллами для каждого человека. Затем мы можем увидеть, где находятся мои оценки полигенности в распределении любой из сотен доступных в настоящее время оценок полигенности. Никаких фенотипических данных не требуется – только ДНК. То есть, ничего не зная о моих депрессивных симптомах, я могу сравнить свою полигенную оценку депрессии с полигенными оценками сравнительной выборки.
Моя команда и я создали полигенные оценки для широкого спектра признаков, используя мои генотипы SNP, полученные из SNP-чипа в нашей лаборатории на основе результатов исследований GWA, описанных в предыдущей главе. Мы сравнили мои полигенные баллы с баллами выборки из 6000 неродственных людей, участвовавших в моем исследовании раннего развития близнецов в Великобритании. Неважно, что в эту группу сравнения входят молодые люди, потому что ДНК не меняется – группой сравнения могут быть и младенцы.
наиболее прогностическим полигенным показателем является рост, который объясняет 17% дисперсии роста взрослых. Хотя рост не является психологической чертой, он полезен как беспристрастный пример для понимания того, как работают полигенные оценки и как их интерпретировать. Мы использовали результаты GWA для роста, чтобы создать полигенные оценки для меня и для каждого человека в выборке ЭТДП. Полигенная оценка, полученная из GWA роста взрослого человека, предсказывает 15% дисперсии роста молодых людей в TEDS.
Чтобы интерпретировать полигенные оценки, важно помнить, что они всегда распределяются по колоколообразной кривой, то есть по нормальному распределению. Эта колоколообразная кривая продиктована фундаментальным законом вероятности или центральной предельной теоремой , лежащей в основе всей статистики. Нормальное распределение обнаруживается, когда множество случайных событий вносят свой вклад в явление, например, подбрасывание монеты и подсчет количества раз, когда монета выпадает орлом. Если вы подбросите монету десять раз, вы можете не получить ни одного орла или десять орлов подряд, но в большинстве случаев общее количество орлов будет от четырех до семи. Если вы сделаете это много раз, вы получите совершенно нормальное распределение в форме колокола, достигающее максимума в пять, что и будет средним числом орлов. Подбрасывание монет и подсчет решек в точности аналогичны подсчету количества «растущих» аллелей из SNP для построения полигенных оценок для многих людей.
Я опишу все свои полигенные баллы в виде процентилей нормального распределения. То есть насколько моя полигенная оценка выше или ниже средней полигенной оценки в выборке сравнения, 50-м процентиле? Оказывается, моя полигенная оценка роста находится на уровне 90-го процентиля. Итак, основываясь только на моей ДНК, ничего не зная обо мне, вы можете предсказать, что я высокий. И, на самом деле, я 6 футов 5 дюймов. Конечно, вы могли бы легко увидеть, что я высокий, если бы увидели меня, но с ДНК вы могли бы сказать, что я высокий, даже не глядя на меня.
Самое главное, вы могли предсказать, когда я родился, что я буду высоким. В отличие от любых других предикторов полигенные баллы столь же предсказуемы с рождения, как и с любого другого возраста, потому что унаследованная последовательность ДНК не меняется в течение жизни. Напротив, рост при рождении едва ли предсказывает рост взрослого человека. Предсказательная сила полигенных оценок выше, чем у любых других предикторов, даже у роста родителей людей. Еще одно преимущество полигенных оценок перед семейным сходством заключается в том, что рост родителей дает прогноз только для всей семьи, который одинаков для любого ребенка, рожденного от этих родителей. Напротив, полигенные оценки дают прогноз, специфичный для каждого человека. Другими словами, мои показатели полигенности при рождении предсказали бы, что я буду выше, чем ожидалось, исходя из среднего роста моих родителей.
Прежде чем перейти к другим моим полигенным показателям, необходимо подчеркнуть еще один общий момент, касающийся предсказания личности. Мой реальный рост находится на уровне 99-го процентиля, но моя полигенная оценка находится на уровне 90-го процентиля. Достаточно ли точны полигенные оценки для предсказания?








