Ақпарат

GWA зерттеуіндегі SNP шартты талдауы нені білдіреді?


Мен күрделі белгілерге қатысатын гендік локустарды анықтау үшін геномдық қауымдастықты зерттеулерде тег-SNP қолдануымен таныспын, бірақ мен ешқандай түсініктемесіз қолданылатын «шартты талдау» терминін көремін. Бұл SNP тегінің маңыздылығы нөлге дейін төмендетілген математикалық манипуляцияның қандай да бір түрі ме, басқа SNP-тердің қарастырылып отырған фенотиппен тікелей байланысы бар ма?


GWA зерттеулерінде сіз генотиптері корреляцияланған аймақтарда (байланыс тепе-теңдігі ретінде белгілі) «жетекші» SNP-лерді талдауға бейімсіз.

Егер нәтижемен басқа SNP арасындағы байланысты тапсаңыз және бұл SNP бастапқы нұсқамен корреляцияланса, шартты үлгідегі бастапқы SNP үшін реттейтін талдау. Бұл 2-ші SNP арасындағы байланыс біріншіден тәуелсіз ме, әлде олар корреляция болғандықтан ба (LD-де) тексеру үшін.

Сонымен, шартты талдауды орындау тек байқалған ассоциацияның тәуелсіз сигнал екенін көру болып табылады.

Кем дегенде, мен мұны бұрыннан осылай түсіндім!


Мысалы, SNP-A 2 типті қант диабеті (T2D) қаупінің жоғарылауымен байланысты екені анықталды.

SNP-B кейінірек T2D қаупімен де байланысты екені анықталды.

SNP-A және SNP-B өзара байланысты.

SNP-B және T2D арасындағы байланыс бірінші байланысқа тәуелсіз екенін көру үшін үлгідегі SNP-B үшін реттейсіз (a шартты талдау).

Бірінші үлгі: lm( T2D ~ SNP-A + шатастырғыштар) Екінші үлгі: lm ( T2D ~ SNP-A + шатастырғыштар + SNP-B)

Егер SNP-A (және/немесе SNP-B) және T2D арасындағы байланыс әлі де маңызды болса, олардың T2D қаупіне тәуелсіз әсері болады. Қауымдастық жойылса, олар тек жеке тұлғаларда өзара байланысты болғандықтан екеуі де байланысты.


MAGMA: GWAS деректерінің жалпыланған гендік жиынтық талдауы

Күрделі белгілердің генетикасы бөлімі, Нейрогеномика және когнитивті зерттеулер орталығы, Амстердам VU университеті, Амстердам, Нидерланды, Есептеу және ақпарат ғылымдары институты, Ниймеген Радбуд университеті, Ниймеген, Нидерланды

Affiliation Informatics институты, Амстердам университеті, Амстердам, Нидерланды

Есептеу және ақпарат ғылымдарының серіктестік институты, Ниймеген Радбуд университеті, Ниймеген, Нидерланды

Күрделі белгілердің генетикасы бөлімі, Нейрогеномика және когнитивті зерттеулер орталығы, Амстердам VU университеті, Амстердам, Нидерланды, Клиникалық генетика бөлімі, Амстердам VU университетінің медициналық орталығы, Амстердам нейробиологиялық кампусы, Нидерланды


GWA ЗЕРТТЕУДІҢ МЕТА-АНАЛИЗІ

GWA әдісі 2000-шы жылдардың ортасында алғаш рет хабарланған (Welter және т.б. 2014) көптеген зерттеулер үшін ақпараттандырылғанымен, GWAS зерттеген аурулардың генетикалық этиологиясының елеулі бөлігі әлі түсіндірілмеді, бұл AMD үшін дұрыс. анықталған тәуекел нұсқалары AMD генетикалық бөлігінің 15% �% құрайды деп бағаланады (Manolio et al. 2009). Аурумен байланысты генетикалық вариацияны анықтауды жақсартуға арналған тәсілдер дәстүрлі GWA тәсілінен асып түсті және анықтамалық үлгі үшін белгілі генетикалық ақпаратты пайдалана отырып нұсқаларды енгізуді, шартты талдауларды орындауды және жол талдауларын жүзеге асыруды қамтиды.

Зерттеулердің іріктеме көлемін ұлғайту өте маңызды, өйткені жағдайлар мен бақылаулардың үлкен үлгі өлшемдері қызығушылық ауруына байланысты генетикалық вариацияны анықтауды жеделдетеді. Тексерілген үлгілердің санын көбейтумен қатар, сыналған нұсқалар санын көбейту GWA деректеріне импутация жасау арқылы қол жеткізуге болатын мақсатқа айналды. Импутация – типтелмеген SNP генотиптерін шығару арқылы GWA зерттеуінде сұралған нұсқалардан тыс сыналған нұсқалардың санын айтарлықтай арттыратын әдіс. GWA-сұрақталған SNP-дегі белгілі генотиптерді анықтамалық панельдегі ДНҚ тізбегімен біріктіре отырып, көптеген SNP-лердегі генотиптерді әртүрлі дәрежедегі сенімділік пен дәлдікпен шығаруға болады. Импутация сынауға болатын SNP санын көбейту арқылы GWA зерттеулерінің күшін арттырып қана қоймайды, сонымен қатар себепті нұсқамен жоғары байланыс тепе-теңсіздігінде себептік нұсқаларды және/немесе SNP-терді тиімдірек анықтауға әкелуі мүмкін (Marchini and Howie 2010 Li және т.б. 2009). Импутация байланысты нұсқаларды анықтау мүмкіндігін жақсарту үшін AMD бірнеше зерттеулерінде жүзеге асырылды (Fritsche et al. 2013 Helgason et al. 2013 Seddon et al. 2013).

Сипатталған әдістерді біріктіретін зерттеулер GWA деректерінің мәнін айтарлықтай арттырады. AMD ген консорциумының (Fritsche et al. 2013) ең соңғы жарияланымында GWA деректерін пайдалану арқылы дәстүрлі түрде енгізілген әдістерден тыс жеті жаңа нұсқа анықталды. 7650 жетілдірілген AMD корпусынан және 51 844 басқару элементінен алынған GWA деректерін пайдаланып және HapMap II адамдық вариация анықтамалық деректер жинағына (Frazer et al. 2007) енгізу арқылы Консорциум 2,5 миллионға жуық жалпы SNP бағалады. Олардың 32-сі қосымша 9531 жағдайда және 8230 бақылауда қосымша бағаланды. Бірлескен талдау кезінде геномдық мәнге ие 19 жалпы локус анықталды П < 5 × 10 𢄨. Маңызды локустарға бұрын анықталған 12 нұсқа кірді ARMS2-HTRA1, CFH, C2-CFB, C3, TIMP3, APOE, CETP, VEGFA, TNFRSF10A, LIPC, CFI, және COL10A1, коэффициенттері 1,13 (COL10A1) дейін 2,71 (ARMS2-HTRA1). Қосымша жеті нұсқа COL8A1-FILIP1L, IER3-DDR1, SLC16A8, TGFBR1, RAD51B, ADAMTS9, және B3GALTL Алғаш рет геномдық мәнге ие болды, коэффициенттері 1,11 (RAD51B) дейін 1,28 (COL8A10-FILIP1L) (Fritsche et al. 2013).

Бұл зерттеу сонымен қатар AMD кіші түрі, жынысы және ата-тегі бойынша стратификацияны зерттеу арқылы дәстүрлі GWA әдістерінен шықты. Ерекше қызығушылық, CFH тәуекел аллельдері хороидты неоваскуляризациямен салыстырғанда географиялық атрофия қаупімен басымырақ байланысты болды және азиялықтармен салыстырғанда еуропалықтарда ассоциацияның күшті дәлелдері болды. Тәуекел аллельдерінің жұптары жалғыз пайда болған аллельдерге қарағанда жоғары қауіп төндіретінін зерттейтін өзара әрекеттесу талдаулары жақын маңдағы SNPs арасындағы бір әрекеттесуді атап көрсетті. CFH және C2-CFB онда екі локустағы тәуекел аллельдерінің тасымалдаушылары әдетте күтілетінге қарағанда AMD үшін біршама жоғары тәуекелге ие болды. Бұл нәтижелер AMD-дегі комплемент жүйесінің маңыздылығын одан әрі растады және бүгінгі күнге дейін әсер ететін нұсқалардың әрқайсысы үшін әсер өлшемдерінің ең жақсы жалпы бағалауын қамтамасыз етті.

Жолды байыту талдаулары биологиялық байланысты генетикалық сигналдар мен белгілі бір ауруға қызығушылықты тудыратын жолдар арасындағы биологиялық байланыстарды анықтау үшін қолданылады. Бұлар SNP үшін GWA нәтижелерін бағалау арқылы жүзеге асырылады, бұл нақты биологиялық жолдардағы артық көрсетілуді бағалау және биологиялық мағыналы болуы мүмкін, бірақ көптеген ықтимал жалған-оң нәтижелер арасында еленбейтін сигналдарды бағалауға қызмет етеді (Yaspan et al. 2011). Осылайша, жолды талдау GWA нәтижелерін бір SNP талдауларына қарағанда кеңірек бағалау арқылы аурудың функционалдық аспектілерін түсінуді қамтамасыз етеді және белгілі бір p-мәнінің шегіне жетуден басқа SNP үшін ықтимал мағыналы қатынастарды анықтай алады. Мұндай нәтижелер жалпы GWA нәтижелеріне қосымша және контекстінде бағалау үшін маңызды қосымша шағын және/немесе интерактивті әсерлерді бөліп көрсетуі мүмкін. AMD гендік консорциумының ең соңғы жарияланымы жалпы нәтижелерді бағалау үшін INRICH (Genome Wide Association Studies үшін интервал негізіндегі байыту талдау құралы) жол талдауын (Ли және т.б. 2012) енгізу туралы хабарлады (Fritsche et al. 2013). Бұрынғы әсер еткен AMD жолдарын растай отырып, бұл талдау сонымен қатар жеті жаңа локустар арасындағы қосымша қызығушылық жолдарын көрсетті, коллаген мен жасушадан тыс аймақ ақуыздарын кодтайтын гендерге қосымша комплемент пен атеросклеротикалық жолдардағы ақуыздарды кодтайтын гендер, комплемент пен коагуляция каскадтары, липопротеиндердің алмасуы және апоптозды реттеу (Fritsche et al. 2013).


Нәтижелер

Жоғарыда айтылғандай, біздің әдіс популяциялық генетиканы зерттеуде әсіресе пайдалы априори байланыс, гаплотиптер туралы немесе бұл ақпаратты шығару мүмкін емес жерлер туралы биологиялық білім. Осындай зерттеулерде SNP2GO өзектілігін көрсету үшін біз Орозко-Тервенгельдегі базалық және орта эксперимент арасындағы салыстыру нәтижесінде анықталған SNP-ге талдау жасадық. т.б. (2012). Бұл зерттеуде авторлар 2000 үміткер SNP (1,6 миллионнан) тапты. D. melanogaster және процеске ықтимал қатысы бар биологиялық жолдарды тапқысы келді. Біз осы деректер бойынша SNP2GO іске қостық және осы терминдердің әрқайсысына қатысты кемінде 10 гені бар 135 маңызды GO терминін (жалған табу жылдамдығы Дрозофила. Дегенмен, SNP2GO сәйкес GO терминдеріндегі геномдық аймақтардың саны 135 маңызды GO терминінің 120 маңыздылығына ықпал ететін кездейсоқ күткеннен төмен екенін анықтады (П < 0,05, эмпирикалық нөлдік үлестірімге сәйкес). Басқаша айтқанда, GO терминіне бірнеше геномдық аймақтар ғана маңыздылықты тудырды. Демек, SNP2GO сәйкес, осы GO терминдерінің маңыздылығын түсіндіруде абай болу керек, өйткені жергілікті геномдық әсерлер үміткер SNP-лерді топтастыруы мүмкін.

Сондықтан біз Орозко-Тервенгельде табылған SNP-тің геномдық таралуын одан әрі зерттедік. т.б. (2012) және хромосомаларға үміткер SNP-тердің орналасуын талдады. Біз 2000 үміткердің 1568 SNP (яғни, 78% 3R хромосомалық қолында орналасқан (хромосомалық қолдың өлшеміне сәйкес күтілетін 23%). Осы бақылаумен келісе отырып, біз 3R хромосомалық қолы GO терминдерінің маңыздылығына күтілгеннен орташа есеппен 2,6 артық үлес қосатынын анықтадық (3-сурет). Бұл осы GO терминдерінің маңыздылығын қарапайым, бейімделмейтін, биологиялық түсіндіруге әкеледі. The Дрозофила Орозко-Тервенгель популяциялары т.б. (2012) космополиттік инверсияны бөліп зерттеді ln(3R)Payne, ол 3R хромосомалық қолында ~8 Мб аймақты қамтиды. Рекомбинацияның басылуы инверсия аймағынан тыс кеңейетіндіктен (Эванс т.б. 2007), LD осы хромосомалық қолдың үштен бірінен астамына әсер етеді деп күтілуде, бұл SNP2GO хабарлағандай, осы геномдық аймақта орналасқан гендердің бірегей үлесін түсіндіреді. Бұл бақылауды жақында Тоблер растады т.б. (2013).

GO терминдерінің маңыздылығына ықпал ететін гендердің бақыланатын/күтілетін қатынасы. 3R, аутосомды қол 3R Демалыс, басқа хромосомалар.


Алғыс

Біз CSC (IT Center for Science) мен Молекулярлық медицина институтының технологиялық орталығына есептеу қызметтері үшін алғыс айтамыз. Финляндияның Молекулярлық медицина институтының жоғары өнімді биомедицина бөлімі, Р.Кованен және А.Уро техникалық сараптама үшін мойындалған. М.Яухиаинен қолжазба жазу процесіндегі тәжірибесімен бөліскені үшін мойындалады. Бұл зерттеуге Еуропалық Одақтың Жетінші Негіздемелік бағдарламасы (FP7/2007–2013), ENGAGE Консорциумы, HEALTH-F4-2007-201413 гранттық келісімі арқылы қолдау көрсетілді. I.S. Хельсинки университетінің биомедицинадағы докторлық бағдарламасы (DPBM) ішінара қаржыландырылды. М.Х. Шетелде жұмыс істейтін жас ғалымдарға Manpei Suzuki Diabetes Foundation Grant-in-Aid арқылы қаржыландырылды. А.П.М. және А.Махаджан WT098017, WT090532 және WT064890 марапаттары бойынша Wellcome Trust-тан қаржыландыруды мойындайды. В.Лагу, Л.М., С.Х. және И.П. ішінара Еуропалық Одақтың Жетінші негіздемелік бағдарламасы (FP7/2007–2013), ENGAGE жобасы, HEALTH-F4-2007- 201413 гранттық келісімі арқылы қаржыландырылды. LM ішінара Феррара университетіне тағайындалған «5 промилле» жарнасы арқылы демеушілік етті. , 2009 жылғы табыс салығы бойынша декларация және ішінара ENGAGE оқу қорлары үшін ENGAGE Exchange және Mobility бағдарламасы бойынша. М.Д.Т. Ұлыбританияның Медициналық зерттеулер кеңесінің аға клиникалық стипендиясына ие (G0902313). С.Т. Sigrid Juselius қорының қолдауымен. J.S.R. және C.G. РФБР (Ресей іргелі зерттеулер қоры) – Гельмгольц біріккен зерттеу тобының (12-04-91322) гранты бойынша қаржыландыруды алды. C.G. 305280 (MIMOmics) гранттық келісім бойынша Еуропалық Одақтың Жетінші Негіздемелік бағдарламасынан (FP7-Health-F5-2012) қаржыландыру алды. М. Перолаға Еуропалық Одақтың Жетінші Негіздемелік бағдарламасы (грант келісімдері 313010 BBMRI-LPC, 305280 MIMOmics және 261433 BioSHaRE-EU), Финляндия академиясының 269517 гранты, Yrjö Jahnssoninio Foundation және Juho қоры қолдау көрсетті. N.J.S. Британдық жүрек қоры (BHF) қаржыландыратын кафедра меңгерушісі және NIHR аға тергеушісі. C.P.N. BHF қаржыландырады және NIHR Leicester жүрек-қан тамырлары биомедициналық зерттеу бөлімі тарапынан қымбат қаржыландырылған. В.Саломаға Финляндияның жүрек-қан тамырларын зерттеу қоры мен Финляндия академиясы (грант 139635) қолдау көрсетті. Э.Иконенге Финляндия академиясының биомембраналық зерттеулердегі шеберлік орталығы (272130), Финляндия академиясы (263841) және Сигрид Юселиус қоры қолдау көрсетті. В.П. Хельсинки университетінің докторантурадан кейінгі зерттеуші гранты, Магнус Эрнрут қоры және Кименлааксо мәдени қоры қолдау көрсетті. О.Қ., Дж.-П.М. және В.П. 258068 EU-FP7-Systems Microscopy Network of Excellence гранттық келісімі бойынша Еуропалық Одақтың Жетінші Негіздемелік бағдарламасынан (FP7/2007–2013) қаржыландыруды алды. С.Р. Финляндия академиясы (251217 және 255847), Кешенді аурулар генетикасы бойынша шеберлік орталығы, Еуропалық Одақтың ENGAGE (201413) және BioSHaRE (261433) жетінші негіздемелік бағдарламасы жобалары, Финляндияның жүрек-қан тамырлары зерттеулері қоры, Хельсинки және Biocentrum қолдау көрсетті. Сигрид Джуселиус қоры. Когортқа тән растаулар Қосымша ескертуде берілген.


Әдістері

Концептуалды тәсіл

Эксперименттік емес зерттеулер шатастыруға және кері себептілікке бейім. MR инструментальды-айнымалылар құрылымын пайдалана отырып, аллельдердің кездейсоқ ассортиментін, тұжырымдама кезінде генотипті тағайындауды және плейотропияны (бірден көп белгілерге әсер ететін гендер) пайдалану арқылы осы мәселелерді шешеді 25,40,41 . Генетикалық нұсқаларды пайдалану қоршаған ортаны шатастырудың көптеген көздерін болдырмайды және тұжырымдама кезінде генотипті тағайындау кері себептіліктің көптеген көздерін болдырмайды, өйткені генотиптер қызығушылықтың бақылау айнымалыларынан уақытша бұрын болады.

Екі үлгілі MR – екі жалпы геномдық ассоциация (GWA) зерттеулерінің жиынтық статистикасын пайдаланатын процедураның нұсқасы 42,43,44,45,46,47 . Әдетте, екі үлгілі MR кезінде IVW әдісі стандартты тәсіл болып табылады (1-суретте мысал бар).

Теломера ұзындығының эритроциттерге (ҚРБ) себеп-салдар әсерінің сынағы арқылы екі үлгілі MR иллюстрациясы мысал ретінде есептеледі. SNP-теломера ұзындығының ассоциациясын бағалау ( (>_) ) 1-үлгіде есептелген (теломера ұзындығының алдыңғы GWA зерттеуінен). Сол SNP және эритроциттер саны арасындағы байланыс 2-үлгіде ( (>_) бағаланады.) ) (эритроциттер санының GWA зерттеуінен). Аспаптық SNP бағалаулары Уолд коэффициенттеріне біріктірілген ( (>_=hspace<0,17em>>_/>_)). (>_) қатынасты бағалау кері дисперсиялық өлшенген (IVW) талдауын ( (widehat<eta >) пайдаланып мета-талданады. IVW) эритроциттер саны бойынша теломер ұзындығының жалпы себептік бағасын беретін әдіс. Сезімталдық бағалаушылары IVW себеп-салдарлық бағалауының орынды екенін анықтау үшін қолданылады (төменде толығырақ).

Мендельдік рандомизацияның болжамдары

MR үш болжамның дұрыстығына сүйенеді 48 . Осы талдау контекстінде бұл болжамдар төмендегідей: (1) теломера ұзындығының аспаптық айнымалысы ретінде әрекет ететін SNP теломера ұзындығымен қатты байланысты (2) теломера ұзындығына байланысты SNP теломера ұзындығының шатастырушыларына тәуелсіз және қызығушылық нәтижелері және (3) теломера ұзындығы SNPs тек теломер ұзындығы арқылы қызығушылық нәтижелерімен байланысты (көлденең плейотропия жоқ SNP теломера ұзындығына тәуелсіз нәтижелермен байланысты емес 44,48 ).

Құрал құрылысы

Теломера ұзындығы аспаптары үшін ( (>_) 1-суретте), геномдық маңызы бар SNPs (П < 5 × 10 –8 ) теломера ұзындығы бойынша стандартты ауытқуы (SD) бар, оның жиынтық статистикасы (әсерді бағалау және стандартты қателер) біріктірілген және Haycock және т.б. 20 таңдалды. Түпнұсқалық теломерлік ұзындықтағы GWA зерттеуі еуропалық шыққан 3 9190 адамға (18-95 жас аралығындағы ерлер мен әйелдер) алты когорта бойынша жүргізілген мета-талдау болды. (Алты когорттың егжей-тегжейлі сипаттамасы басқа жерде 49,50,51,52,53,54 қол жетімді, бірақ анықтаманы жеңілдету үшін Mangino және т.б. 3 теломера ұзындығының мета-анализіне келесі алты когортты қосты: Фрамингем жүрегі Зерттеу, жанұялық жүректі зерттеу, жүрек-қан тамырлары денсаулығын зерттеу, Bogalusa Heart Study, HyperGEN және TwinsUK). Mangino және т.б. 3 жасына, 2 жасына, жынысына және темекі шегу тарихына сәйкес түзетілген және негізгі құрамдастарды талдау арқылы еуропалық емес ата-тегі тексерілген. Мета-анализден осы MR талдауы үшін он алты SNP қол жетімді болды (қосымша кесте 19). Тәуелсіз болғандар (байланыс тепе-теңдігінде емес, LD, r 2 < 0,001, 1000 геном жобасына (https://www.internationalgenome.org/) сілтеме жасай отырып, 10 000 килобазалардың жиналу қашықтығында) сақталды және Осы критерийлерге сәйкес келмегендер алынып тасталды.Сақталған SNP үшін сәйкес әсер бағалаулары мен стандартты қателер қандағы GWA зерттеулерінен алынды ( (>_)) 1-суретте). Қанға тән GWA зерттеулерін Astle және т.б. халық саны бойынша 21 адам

Негізінен Ұлыбританиядан шыққан еуропалық 173 000 адам (Ұлыбританияның биобанкі мен интервалдық зерттеулерінің мета-талдауы). Олар негізгі құрамдас бөліктерге және зерттеу орталығына сәйкестендірілген және қанның қатерлі ісігі немесе қанның негізгі бұзылулары бар адамдарды алып тастады.

Қан белгілерінің GWA зерттеулерінде SNP қол жетімді болмаған кезде, SNP r 2 ≥ 0,80 (1000 геном жобасы арқылы бағаланған) LD ішіндегі «прокси» SNP таңдалды. Егер «прокси» SNP қол жетімді болмаса, SNP талдаудан жойылды. SNP-әсер ету және SNP-нәтиже бірлестіктері R 42,55 шегінде MR-Base «TwoSampleMR» пакетіндегі «үйлестіру_деректер» функциясымен үйлестірілді. Гармонизацияланған SNP-экспозиция және SNP-нәтиже бірлестіктері IVW әдісімен біріктірілді (1-сурет).

Барлық сынақтар үшін SNP шектен тыс мәндерін анықтау үшін RadialMR регрессия 56 іске қосылды. Шектеулі SNP жойылды. (Шеше мәндердің жойылуына және нәтиже деректер жинағында SNP немесе оның «прокси» қол жетімді болуына байланысты әртүрлі қан белгілері үшін теломер ұзындығының әртүрлі саны SNP пайдаланылды.) Бұл талдауға енгізілген барлық аспаптық айнымалылар Кокранның мәніне ие. Q-статистикалық П- SNP 57 арасындағы гетерогенділіктің дәлелі жоқ мәндер (біртектілік статистикасы қосымша 10-18 кестелерде берілген).

Таңдалған SNP тәуелсіз геномдық аймақтарға сәйкес келеді және лейкоциттердің теломера ұзындығының (R 2) дисперсиясының 1%-дан 2%-ға дейінін құрайды, бұл Ф-14 пен 17 арасындағы статистика. Ф-статистика IVW нәтижелерінің нөлдік гипотезаны жоққа шығарудың статистикалық күші төмендегенін анықтау үшін қолданылады. Бұл теломер ұзындығының құралы лейкоциттердің теломера ұзындығындағы дисперсияның шектеулі үлесін түсіндірсе, орын алуы мүмкін. Ф-статистика > 10 шартты түрде қолайлы болып саналады 58,59 . The Ф-статистика және оларды есептеу үшін қолданылатын R 2 мәндері 1-кестеде берілген.

Одан басқа, I Сезімталдық бағалауыштарының бірінде (MR-Egger регрессиясында) әлеуетті әлсіреу ауытқуын бағалау үшін пайдалы 2 статистика берілген (сонымен қатар 1-кестеде). I 2 статистика < 90% MR-Egger бағалауындағы сұйылтуды көрсете алады, бұл MR-Egger үзу сынағы (төменде қараңыз) нәтижелері ықтимал дәл емес екенін білдіруі мүмкін. Потенциалды регрессия сұйылту үшін MR-Egger бағалауын нөлге реттейтін түзету процедурасы симуляциялық экстраполяция (SIMEX) үшін ұсынылады. I 2 статистика < 90% 60 . SIMEX нәтижелері 10-19 қосымша кестелерде берілген.

Сезімталдықты талдау

IVW бағалаушысы біржақты болуы мүмкін, егер аспаптық SNP-нің кез келгені генетикалық құрал туралы MR болжамын бұзса, әсер етуден тәуелсіз нәтижеге тікелей әсер етпейді 61. MR болжамының (3) ықтимал бұзылуын бағалау үшін үш сезімталдық бағалаушысы — MR-Egger регрессиясы, салмақты медиана және салмақты режим әдістері — іске қосылды және олардың нәтижелері IVW нәтижелерімен салыстырылды. Сезімталдық бағалаушылары плейотропияның негізгі табиғаты туралы әртүрлі болжамдар жасайды. Осылайша, егер олардың әсер ету бағыттары мен шамалары IVW әсеріне сәйкес келсе, бұл плейотропияға қарсы сапалы экран (сол сияқты олардың әсерлерінің гетерогенділігі плейотропияны көрсетеді) 62 . IVW және сезімталдық бағалаушыларын салыстыру триангуляция мен білім синтезінің бір түрі болып табылады, яғни нәтижелердің себептілік байланысына сәйкестігін анықтау процесі әртүрлі әдістермен, күштермен және шектеулермен зерттеулерді жүйелі түрде шолу кезінде тергеушілер жасайтын әрекет сияқты.

MR бағалаушыларының терең түсіндірмесі және олардың жорамалдары басқа жерде қамтылған 61,63,64 . MR-Egger кесу сынақтарының нәтижелерін қоспағанда, IVW және сезімталдық бағалаушылары үшін нәтижелер 1-кестеде берілген. MR-Egger регрессиясы әсерді бағалауды да, бағытталған плейотропияға арналған сынақты да қамтамасыз етеді (MR-Egger кесу сынағы). Плеиотропияға арналған MR-Egger үзіліс сынағы теломера ұзындығы мен қан жасушаларының белгілері арасындағы байланыстарды сынайтын бағалаушыларға қарағанда басқаша түсіндіріледі. MR-Egger кесіндісі нөлден айырмашылығы болмаған кезде (П > 0,05), бұл плейотропияға қарсы дәлел. MR-Egger кесу нәтижелері қосымша 10-18 кестелерде берілген.

Тесттер саны

Барлығы тоғыз MR сынағы орындалды (әр үлгіде пайдаланылатын жеке SNP үшін егжей-тегжейлі сипаттамалар 1-9 қосымша кестелерде берілген). Қан белгілері арасындағы корреляцияға байланысты ол өте консервативті болса да, талдаулар бойынша бірнеше тестілеуді есепке алу үшін Бонферрони түзетуі П- күшті дәлелдер үшін мән шегі (П < 0,006) (жалған-оң көрсеткіш = 0,05/9 нәтиже).

Статистикалық бағдарламалық қамтамасыз ету

SIMEX түзетулері Stata SE/16.0 65 ішінде орындалды. Барлық басқа сипатталған талдаулар R 3.5.2 нұсқасында “TwoSampleMR” бумасымен орындалды 42 .


Талқылау

Кеміргіштердің модельдері кокаин мен метамфетаминнің физиологиялық, молекулалық және мінез-құлық әсерін зерттеу үшін ұзақ уақыт бойы қолданылған, бірақ үлгі өлшемдеріндегі шектеулер, кең байланыстар себебінен есірткіге тәуелділікке ықпал ететін бірнеше сегрегациялық гендердің себептік нұсқаларын анықтау үшін қолайлы емес. картографиялаудың көптеген популяцияларындағы тепе-теңдік және шығындарды ескеру. D. melanogaster бұрын этанолды тұтынудың генетикалық архитектурасын (27), алкогольге сезімталдықты (34) және тамақтану тәртібін (35) бөлу үшін қолданылған. Мұнда біз AIP-де xQTL салыстыруды қолдандық D. melanogaster кокаинмен немесе метамфетаминмен толықтырылған сахарозаны көп тұтынатын адамдарда табиғи түрде дифференциалданатын аллельдерді анықтау. Біз аннотацияланған гендердің 1 кб ішінде маңызды нұсқаларды анықтадық және кокаин мен метамфетаминді тұтынудың артуына байланысты генетикалық желіні құрдық. Біз GWA талдауларынан үміткер гендер үлгісінің RNAi сыналған гендердің 77% кокаинді және/немесе метамфетаминді тұтынуға әсер еткенін көрсеттік. Біздің аллельге тән AIPs есірткіні тұтынумен байланысты интергендік және интрагендік SNP-ге функционалды әсер етті. Біз GWA қауымдастықтары, RNAi құрылымдары және аллельге тән AIP деңгейінде ерікті кокаин мен метамфетаминді тұтынудың генетикалық архитектурасының негізінде жатқан жыныстық диморфизмнің кең генетикалық вариациясын таптық, бұл бұрынғы зерттеулерге сәйкес есірткіні тұтыну ерекшеліктері үшін жыныстық диморфизмді құжаттады. D. melanogaster (20, 36), кеміргіштер (37, 38) және адамдар (39).

Кокаин мен метамфетаминнің әсері туралы алдыңғы зерттеулер Дрозофила бірінші кезекте бір генді мутанттардың мінез-құлық әсерлеріне бағытталған (40, 41). Бұрын біз DGRP желілерінің ішкі жиынында есірткі тұтыну қасиеттерінің табиғи генетикалық вариациясын бағаладық (20). Дегенмен, бұл зерттеудегі жолдардың аздығы үлкен әсерлері бар жалпы нұсқаларды анықтауға мүмкіндік берді. AIP және xQTL картасын пайдалану статистикалық қуатты арттырады және кокаин немесе метамфетаминді тұтынудың жоғарылауымен байланысты 988 гендегі 1307 нұсқаны анықтауға мүмкіндік берді, олардың 209-ы алдыңғы зерттеуімізде анықталған, соның ішінде Арр, Eip75B, сорпа, Түсп, кет1, Моб2, және күз (20). Бұл гендер жүйке жүйесінің дамуына қатысатын биологиялық процестер үшін байытылған, соның ішінде аксонды басқару, аксон ұзарту, дендрит морфогенезі және синаптикалық нысананы тану.

Жүйке жүйесінің дамуына байланысты гендер бұрын шыбындардың есірткі тұтыну қасиеттеріне қатысты болды (20). Жүйке жүйесінің дамуы біз жасаған 77 геннен тұратын генетикалық өзара әрекеттесу желісінде қайталанады (2-сурет).Б), ол Wnt, Notch және Hippo (Dataset S6) қоса алғанда, даму сигналдық жолдары үшін байытуды көрсетеді. Тышқандарда Wnt сигналы кокаин тудыратын нейропластикалықта рөл атқарады (42) және кокаин қан-ми тосқауылын (43) бұзу арқылы Notch сигналын белсендіреді. Бұл желідегі 77 геннің 64-інде адамның ортологы бар (DIOPT ≥ 3). Біз осы ортологтар мен есептеу арқылы алынған гендерден тұратын өзара әрекеттесу желісін құра аламыз (Cурет 2).C), психостимуляторларға сезімталдықтың вариациясының негізінде жатқан іргелі биологиялық процестердің эволюциялық сақталуын ұсынады.

Біз RNAi кокаинді немесе метамфетаминді тұтынуға әсер ететінін бағалау үшін 22 кандидат генін таңдадық. Біз осы гендердің 17 (77%) әлсіз барлық жерде болатын драйверді пайдаланып RNAi құлатқаннан кейін кокаинді немесе метамфетаминді тұтынуда айтарлықтай айырмашылықты көрсеткенін анықтадық. Кандидат гендердің РНҚ нокдаунында препаратты тұтынуға әсерін көрсетпеу функционалдық артықшылыққа, нокдаунның жеткіліксіз дәрежесіне (РНҚ нокдаунының дәрежесі фенотиптік әсерге сызықтық байланысты емес екенін ескеру) немесе кандидат ген болуы мүмкін. жалған оң.

RNAi шектеулерінің бірі оның SNP негізіндегі валидация әдісінен гөрі генге негізделгенін қамтамасыз етуі және кейбіреулері үлкен фенотиптік әсерлері бар интергендік SNP-лердің себептілігін анықтау үшін пайдаланыла алмайды. Кокаин мен метамфетаминді тұтынудың өзгеруіне ықпал ететін себеп-салдарлық SNP-лерді растау үшін біз рандомизацияланған генетикалық фондарда үміткер SNP-тердің баламалы аллельдерін оқшаулау үшін аллельге тән AIP-терді жасадық. Бұл интрагендік және интергендік SNP-лерді тексерудің тиімді әдісін қамтамасыз етті. AIP-тің біреуінен басқасы кем дегенде бір жыныстағы баламалы аллельдер арасындағы тұтынуда айтарлықтай айырмашылықтарды көрсетті. Көптеген SNP үшін құрамында «жоғары тұтынушы» («Н») аллелі бар популяция кем дегенде бір жыныстағы «бақылау» («C») аллелі бар популяцияға қарағанда дәріні көбірек тұтынды. Алайда бір жағдайда құрамында H аллелі бар популяция С аллелі бар популяцияға қарағанда препаратты аз тұтынған, бұл эпистазға байланысты болуы мүмкін, бұл күрделі белгілердің көрнекті белгісі (44, 45).

Біз кокаинді тұтынудағы вариациямен байланысты аллельдік нұсқаларды растаған төрт геннің барлығында адам ортологтары бар. The бір ойлы (сим) ген эмбриональды орталық жүйке жүйесінде (46) ортаңғы сызық түзілуінің оң реттегіші ретінде анықталған және дернәсілдік мидағы аксонды бағыттауда (47) рөл атқаратын спираль-ілмек-спираль транскрипциясы факторын кодтайды. DIP-zeta Dpr әрекеттесетін ақуызды кодтайды. The Дрозофила геномында 21 мүше бар Дпр гендік отбасы және кодталатын тоғыз паралог Дпр әрекеттесетін белоктар. Бұл белоктардың құрамында иммуноглобулиндік домендер бар және DPR және DIP-тің бірегей жұпталған комбинациялары нейрондық байланысты біріктіретін синаптикалық серіктестер ретінде қызмет етеді (48). Src64B саңырауқұлақ денесінің дамуына ықпал ететін цитоплазмалық ақуыз тирозинкиназасын анықтайды (49). qless митохондриялық электрондарды тасымалдау тізбегінің құрамдас бөлігі болып табылатын Q коферментінің изопреноидты бүйірлік тізбегінің синтезіне қатысатын ақуызды кодтайды. Нейрондары qless мутанттар митохондриялық стресске және каспазаға тәуелді апоптозға ұшырайды (50). Бұл бақылаулар осы гендердің аллельдік нұсқалары нейрондық байланыс пен функцияның өзгеруіне әкеледі, бұл олардың психостимуляторларды тұтынуға бейімділігін модуляциялайды деген түсінікті қолдайды.

Қорытындылай келе, біз туылған популяциялардағы интергендік және интрагендік SNP-нің себептілігін анықтау әдісін әзірледік. Бұл тәсілді RNAi-мен үйлестіре отырып, біз ерікті кокаин мен метамфетаминді тұтынудағы вариацияның негізінде жатқан генетикалық архитектураның жыныстық диморфты және жүйке жүйесінің дамуына байланысты гендер басым екенін көрсеттік. Аллель-спецификалық DGRP-ден алынған AIP-ті пайдалану, әдетте, күрделі белгілердің вариациясымен байланысты жалғыз үміткер SNP-нің себептілігін анықтау үшін қолданылуы мүмкін. Негізгі жасушалық жолдардың эволюциялық сақталуына негізделген, алынған нәтижелер Дрозофила генді ашу моделі адам популяцияларында есірткіге бейімділік бойынша зерттеулерге бағыт-бағдар бере алады.


Анықтамалар

WTCCC: Жалпы геномдық қауымдастықтың зерттеуі 7 жалпы аурудың 14 000 жағдайын және 3 000 ортақ бақылау. Табиғат. 2007, 447: 661-678. 10.1038/natural05911.

Heidema AG, Boer JM, Nagelkerke N, Mariman EC, van der A DL, Feskens EJ: Генетикалық эпидемиологтар үшін мәселе: күрделі ауруларға қатысты SNP-тің көп мөлшерін талдау әдісі. BMC Genet. 2006, 7: 23-10.1186/1471-2156-7-23.

Kooperberg C, Ruczinski I: Монте-Карло логикалық регрессиясының көмегімен өзара әрекеттесетін SNP-лерді анықтау. Генетикалық эпидемиол. 2005, 28: 157-170. 10.1002/gepi.20042.

Мотсингер АА, Ричи MD: Көп факторлы өлшемді азайту: адам генетикасы мен фармакогеномика зерттеулеріндегі гендік-гендік өзара әрекеттесулерді модельдеу және анықтауға арналған талдау стратегиясы. Гум геномикасы. 2006, 2: 318-328.

Юн Ю, Сонг Дж, Хонг С, Ким Дж: Қолдау векторлық машиналарын қолдану арқылы жүректің ишемиялық ауруына бейімділікке қатысты кандидат гендерінің бірнеше бір нуклеотидті полиморфизмдерін талдау. Clin Chem Lab Med. 2003, 41: 529-534. 10.1515/CCLM.2003.080.

Бюро A, Dupuis J, Falls K, Lunetta KL, Hayward B, Keith TP, Van Eerdewegh P: Кездейсоқ ормандарды пайдаланып фенотипті болжайтын SNPs анықтау. Генетикалық эпидемиол. 2005, 28: 171-182. 10.1002/gepi.20041.

Диаз-Уриарте Р, де Андрес Альварес С: Кездейсоқ орманды пайдалана отырып, генді таңдау және микромассив деректерін жіктеу. BMC биоинформатика. 2006, 7: 3-10.1186/1471-2105-7-3.

Glaser B, Nikolov I, Chubb D, Hamshere ML, Segurado R, Moskvina V, Holmans P: Analyses of single marker and pairwise effects of candidate loci for rheumatoid arthritis using logistic regression and random forests. BMC Proc. 2007, 1 (Suppl 1): S54-10.1186/1753-6561-1-s1-s54.

Lunetta KL, Hayward LB, Segal J, Van Eerdewegh P: Screening large-scale association study data: exploiting interactions using random forests. BMC Genet. 2004, 5: 32-10.1186/1471-2156-5-32.

Meng YA, Yu Y, Cupples LA, Farrer LA, Lunetta KL: Performance of random forest when SNPs are in linkage disequilibrium. BMC биоинформатика. 2009, 10: 78-10.1186/1471-2105-10-78.

Nonyane B, Foulkes A: Application of two machine learning algorithms to genetic association studies in the presence of covariates. BMC Genetics. 2008, 9: 71-10.1186/1471-2156-9-71.

Sun YV, Cai Z, Desai K, Lawrance R, Leff R, Jawaid A, Kardia SL, Yang H: Classification of rheumatoid arthritis status with candidate gene and genome-wide single-nucleotide polymorphisms using random forests. BMC Proc. 2007, 1 (Suppl 1): S62-10.1186/1753-6561-1-s1-s62.

Breiman L: Random Forests. Machine Learning. 2001, 45: 5-32. 10.1023/A:1010933404324.

Breiman L, Friedman J, Olshen R, Stone C: Classification and Regression Trees. 1984, New York: Chapman & Hall

Breiman L: Bagging Predictors. Machine Learning. 1996, 24: 123-140.

Breiman L: Out-Of-Bag Estimation. 1996, Tech. rep., UC Berkeley

Hastie T, Tibshirani R, Friedman J: Elements of Statistical Learning. 2009, New York: Springer, 2

Genuer R, Poggi JM, Tuleau C: Random Forests: some methodological insights. Tech rep, INRIA. 2008, [http://hal.inria.fr/inria-00340725/en/]

Hafler DA, Compston A, Sawcer S, Lander ES, Daly MJ, De Jager PL, de Bakker PI, Gabriel SB, Mirel DB, Ivinson AJ, Pericak-Vance MA, Gregory SG, Rioux JD, McCauley JL, Haines JL, Barcellos LF, Cree B, Oksenberg JR, Hauser SL: Risk alleles for multiple sclerosis identified by a genomewide study. N Engl J Med. 2007, 357: 851-862. 10.1056/NEJMoa073493.

Browning SR, Browning BL: Rapid and accurate haplotype phasing and missing-data inference for whole-genome association studies by use of localized haplotype clustering. Мен Дж Хум Генет. 2007, 81: 1084-1097. 10.1086/521987.

Purcell S, Neale B, Todd-Brown K, Thomas L, Ferreira MA, Bender D, Maller J, Sklar P, de Bakker PI, Daly MJ, Sham PC: PLINK: a tool set for whole-genome association and population-based linkage analyses. Мен Дж Хум Генет. 2007, 81: 559-575. 10.1086/519795.

Liaw A, Wiener M: Classification and regression by randomForest. Rnews. 2002, 2: 18-22.

Svetnik V, Liaw A, Tong C: Variable selection in random forest with application to quantitative structureactivity relationship. Proceedings of the 7th Course on Ensemble Methods for Learning Machines. Edited by: Intrator N, Masulli F. Springer-Verlag

Oksenberg JR, Barcellos LF: Multiple sclerosis genetics: leaving no stone unturned. Genes Immun. 2005, 6: 375-387. 10.1038/sj.gene.6364237.

Strobl C, Boulesteix AL, Zeileis A, Hothorn T: Bias in random forest variable importance measures: illustrations, sources and a solution. BMC биоинформатика. 2007, 8: 25-10.1186/1471-2105-8-25.

Pearson TA, Manolio TA: How to interpret a genome-wide association study. ЖАМА. 2008, 299: 1335-1344. 10.1001/jama.299.11.1335.

Australia, Consortium NZMSG: Genome-wide association study identifies new multiple sclerosis susceptibility loci on chromosomes 12 and 20. Nature Genetics. 2009, 41: 824-828. 10.1038/ng.396.

Ward GR, Franklin SO, Gerald TM, Dempsey KT, Clodfelter DE, Krissinger DJ, Patel KM, Vrana KE, Howlett AC: Glucocorticoids plus opioids up-regulate genes that influence neuronal function. Cell Mol Neurobiol. 2007, 27: 651-660. 10.1007/s10571-007-9151-3.

deJager PL, Jia X, Wang J, deBakker PIQ, Ottoboni L, Aggarwal NT, Piccio L, Raychaudhuri S, Tran D, Aubin C, Briskin R, Romano S, IMSGC : Meta-analysis of genome scans and replication identify CD6, IRF8 and TNFRSF1A as new multiple sclerosis susceptibility loci. Табиғат генетикасы. 2009, 41: 776-782. 10.1038/ng.401.

Morgan AR, Hamilton G, Turic D, Jehu L, Harold D, Abraham R, Hollingworth P, Moskvina V, Brayne C, Rubinsztein DC, Lynch A, Lawlor B, Gill M, O'Donovan M, Powell J, Lovestone S, Williams J, Owen MJ: Association analysis of 528 intra-genic SNPs in a region of chromosome 10 linked to late onset Alzheimer's disease. Am J Med Genet B Neuropsychiatr Genet. 2008, 147B: 727-731. 10.1002/ajmg.b.30670.

Wider C, Lincoln SJ, Heckman MG, Diehl NN, Stone JT, Haugarvoll K, Aasly JO, Gibson JM, Lynch T, Rajput A, Rajput ML, Uitti RJ, Wszolek ZK, Farrer MJ, Ross OA: Phactr2 and Parkinson's disease. Невролог Летт. 2009, 453: 9-11. 10.1016/j.neulet.2009.02.009.

van Roon JA, Lafeber FP: Role of interleukin-7 in degenerative and inflammatory joint diseases. Arthritis Res Ther. 2008, 10: 107-10.1186/ar2395.


Материалдар мен тәсілдер

Patients and the Clinic Trial

Patients in this study were recruited to the SUCCESS-A trial (ClinicalTrials.gov Identifier: NCT02181101), a randomized Phase III study of response to the treatment of early primary breast cancer with adjuvant therapy after surgical resection (Rack et al., 2014 Widschwendter et al., 2015). All patients initially received three cycles of epirubicin, 5-fluorouracil (5-FU), and cyclophosphamide. Patients were then randomized to either receive three cycles of either gemcitabine in addition to docetaxel or docetaxel alone. A second randomization consisted of zoledronate at the conclusion of treatment for either 2 or 5 years. This trial recruited 3754 patients over 18 months in 251 medical centers in Germany, and accrual ended in March 2007. The main study and all pre-specified translational research projects, including the one reported here, were approved by all of the responsible ethics committees and were conducted in accordance with the Declaration of Helsinki. This study was also reviewed and approved by the Mayo Clinic Institutional Review Board. All patients gave written informed consent.

Case Definition for Neutropenia and GWAS

Cases were defined as patients who had at least one of the following events: leukopenia, neutropenia or febrile neutropenia, during cycles one to three of chemotherapy with epirubicin, 5-fluorouracil (5-FU), and cyclophosphamide. Cases were required to meet the toxicity level of Grade 3 or 4 based on the National Cancer Institute (NCI)’s Common Terminology Criteria for Adverse Events v3.0. A total of 1648 patients fulfilled the criteria for cases. Other patients served as controls for the GWAS analysis. Patient DNA samples were genotyped on the Illumina HumanOmniExpress-12v1 G FFPE array (Illumina, San Diego, CA, United States). After remove of 5 related patients and 9 patients who were non-Caucasian (Asian), a total of 3,252 patients (1,635 controls vs. 1,617 cases) who passed QC for genotyping and whose covariate information (Supplementary Table S1) was available were included in the GWAS analysis. Imputation was performed based on 1000 Genomes Project data (Howie et al., 2012). Genotyped SNPs which had a p-value < 1.0E-05 in the initial GWAS were used as input SNPs to perform imputation. Genotyping and imputation are described in detail in the Supplementary Methods. Data that were generated in the SUCCESS-A trial, including genotype and clinical phenotype data, as well as a further descriptions of materials can be found in the NCBI database of Genotypes and Phenotypes (dbGaP Study Accession: phs000547.v1.p).

Selection of Pathways, Genes and SNPs

Genes involved in pathways of (1) the pharmacokinetics (PK) and pharmacodynamics (PD) for the chemotherapeutic drugs used in the SUCCESS-A trial, cyclophosphamide, epirubicin and 5-FU were included in this analysis. These candidate genes were identified using the PharmGKB database 1 . Genes involved in the PK/PD of doxorubicin, an analog of epirubicin, were selected because epirubicin is not included in the PharmGKB. (2) Pathways that were shown to be aberrant in breast cancer according to The Cancer Genome Atlas (TCGA) data were included in the analysis (The Cancer Genome Atlas Network, 2012). Those pathways were the PI3K, mTOR, p53, apoptosis, and checkpoint signaling pathways. Genes in these pathways were identified using the Kyoto Encyclopedia of Genes and Genomes (KEGG) database (Kanehisa and Goto, 2000). (3) The PAM50 genes which have been shown to be effective in predicting disease prognosis (Nielsen et al., 2010) were also included. (4) Finally, genes studied in our laboratory shown to be functionally relevant in the AKT/mTOR signaling pathways in chemotherapy response (Pei et al., 2009 Hou et al., 2014 Yu et al., 2017) and toxicity (Ingle et al., 2010) were also added to the analysis.

SNPs within 50 kb up- and down-stream, and across the selected genes as described above were included in this analysis. SNPs that were located > 50 kb away from a gene might also affect gene transcription and function. Those SNPs will be overlooked in this study. Genotyping information for SNPs in those pathway genes in the SUCCESS-A patients was obtained from our GWAS genotyping data. Imputation was performed based on 1000 Genomes Project data (Howie et al., 2012). See Supplementary Methods for details.

Association of SNPs With Neutropenia

The analysis for association of SNPs with neutropenia was based on conditional logistic regression to account for the matched design. SNP genotypes were coded as additive effects on the log OR by coding 0, 1, or 2 for the minor allele count. A likelihood ratio test with one degree of freedom for each SNP was then determined. The primary covariates (Supplementary Table S1) used to match cases and controls were controlled in the conditional logistic regression. Association analyses were performed in R 2 , SAS (SAS Institute Inc.) and PLINK. Logistic regression models were used to calculate Odds ratios (ORs), 95% confidence intervals (CIs), and б-values, following corrections for multiple testing.

EQTL Analysis

Single-nucleotide polymorphisms of interest that were associated with neutropenia were further subjected to expression quantitative trait loci (eQTL) analysis using our lymphoblastoid cell line (LCL) data sets, which have been described in detail in our previous studies (Li et al., 2008, 2014 Niu et al., 2010 Matimba et al., 2014 Liu et al., 2017). The Human Variation Panel of LCLs from 96 European-American (EA), 95 African-American (AA), and 96 Han Chinese-American (HCA) healthy subjects were obtained from the Coriell Institute. Those LCLs are B-lymphocytes that were immortalized by Epstein Barr Virus (EBV) infection. Genome-wide genotype data and mRNA expression data for these LCLs have been generated in our laboratory by using the Illumina 550K and 510S SNP BeadChips (Illumina, San Diego, CA, United States), and the Affymetrix Human Genome U133 Plus 2.0 GeneChip arrays (Affymetrix, Santa Clara, CA, United States), respectively. Genotype and gene expression data were deposited in the National Center for Biotechnology Information Gene Expression Omnibus (GEO accession: GSE23120). Expression array data were normalized on a log2 scale using GCRMA (Wu et al., 2004). The normalized expression data were then regressed on gender. Partial Pearson correlations were used to quantify the association between SNPs and mRNA expression. Since the LCLs were from multiple races/ethnic groups, before completing the genetic association analysis, population stratification was assessed using the method developed by Price et al. (2006) as described in detail previously (Niu et al., 2010). These partial correlations were tested using a Wald test. False discovery q-values (Storey and Tibshirani, 2003) were also computed for each test.

Cell Culture and Cytotoxicity Assays

Lymphoblastoid cell lines were cultured in RPMI 1640 media containing 15% fetal bovine serum (FBS). The human promyelocytic leukemia cell line, HL-60, was obtained from the American Type Culture Collection (ATCC, Manassas, VA, United States), and was cultured in RPMI 1640 media containing 10% FBS. Epirubicin (EPI) was purchased from Santa Cruz Biotechnology, Inc. (Santa Cruz, CA, United States). Mafosfamide (MFF) was purchased from Toronto Research Chemicals Inc. (Toronto, Canada). MFF can spontaneously decompose to 4-hydroxy-cyclophosphamide, the active metabolite of cyclophosphamide, when added in culture media (Mazur et al., 2012). Fluorouracil (5-FU) was purchased from Sigma-Aldrich (St. Louis, MO, United States). Cytotoxicity assays with LCLs and HL-60 cells were performed with the CellTiter 96 ® Aqueous Non-Radioactive Cell Proliferation Assay (Promega Corporation, Madison, WI, United States) in 96 well plates (Corning, Corning, NY, United States) at a density of 5 × 10 5 cells/mL (100 μL/well). 10 μL of 5-FU (500𠄰.01 μM), epirubicin (10𠄰.0005 μM), or mafosfamide (100𠄰.005 μM) were added into the wells and incubated at 37ଌ for 72 h. Plates were then added with 20 μL of MTS buffer and read in an Infinite M1000 PRO plate reader (Tecan AG, Switzerland) after incubation for 3 h. Relative cell viability was then plotted against drug concentration to derive a cytotoxicity curve. Experiments were independently repeated at least twice with triplicate wells for each treatment. Тәуелсіз т-test was used to determine statistical significance.

MRNA Quantification

Messenger RNA levels were quantified by quantitative reverse transcription PCR (qRT-PCR) using Power SYBR TM Green RNA-to-CT TM 1-Step Kit (Applied Biosystems Inc., Foster City, CA, United States). Total RNA was extracted from cells by the RNeasy Plus Mini Kit (QIAGEN, Germany). A total of 100 ng of total RNA was used for each reaction. Specific primers for TNFSF13B mRNA were purchased from Integrated DNA Technologies (Coralville, IA, United States). The qRT-PCR reaction was performed using the Stratagene Mx3005P Quantitative Real-Time PCR detection system (Agilent Technologies, Santa Clara, CA, United States). Glyceraldehyde 3-phosphate dehydrogenase (GAPDH) was used as an internal control.

TNFSF13B KD and Ligand Treatment for Cytotoxicity Assays

LCLs and HL-60 cells were incubated at a density of 1 × 10 6 cells/mL in RPMI 1640 with 5% charcoal-stripped FBS for 24 h followed by serum free medium for an additional 24 h. Үшін TNFSF13B KD, cells were transfected with negative control and TNFSF13B siRNAs (Dharmacon, Lafayette, CO, United States) separately, and incubated in RPMI 1640 with 5% charcoal-stripped FBS overnight before cytotoxicity assay. For TNFSF13B ligand (BAFF) treatment, recombinant human BAFF (Cell Signaling Technology, Danvers, MA, United States) reconstituted in PBS containing 200 μM dithiothreitol (DTT) and 0.02% bovine serum albumin was added to the cell culture media at a final concentration of 1 μg/mL and were incubated for 24 h. Vehicle treatment that included DTT and BSA but without BAFF was performed as control. After KD and BAFF treatment, cytotoxicity assays were performed as describe above. Experiments were repeated independently three times.


Genome-Wide Association Studies and Beyond

From the Georgia Prevention Institute (X.W., H.S.), Department of Pediatrics, Medical College of Georgia, Augusta, Ga Unit of Genetic Epidemiology and Bioinformatics (H.S.), Department of Epidemiology, University Medical Center Groningen, University of Groningen, Groningen, the Netherlands.

From the Georgia Prevention Institute (X.W., H.S.), Department of Pediatrics, Medical College of Georgia, Augusta, Ga Unit of Genetic Epidemiology and Bioinformatics (H.S.), Department of Epidemiology, University Medical Center Groningen, University of Groningen, Groningen, the Netherlands.

Сіз осы мақаланың ең соңғы нұсқасын қарап жатырсыз. Алдыңғы нұсқалар:

In spite of recent successes for other complex diseases, essential hypertension has been remarkably reluctant to reveal its underlying susceptibility genes through genome-wide association (GWA) studies. Only after shifting attention to the underlying quantitative traits (ie, systolic [SBP] and diastolic blood pressure [DBP]) and application of “brute force” GWA meta-analyses (n>29 000) of multiple population cohorts in the GlobalBPGen and CHARGE consortia was a tiny tip of the iceberg revealed. 1,2 Six loci for SBP and 9 for DBP were discovered, of which 2 overlapped, yielding 13 independent genome-wide significant signals. However, without exception, the most significant single nucleotide polymorphisms (SNPs) representing these loci only explained a very small part of the total BP variance (≤0.11% Figure). Heritability is well established for BP and typically ranges between 30% and 60%, as estimated in twin or family studies. 3 This means that the majority of the BP heritability is still “missing” and remains at large. 4 Expansion of GWA sample size (eg, in the International Consortium on BP-GWAS, a merger of GlobalBPGen and CHARGE) will likely uncover additional BP variants. 5 However, they will have even smaller effect sizes, and a substantial increase in explained heritability of all loci combined is not expected. GWA studies in general experience a number of other inherent limitations, including a predominant focus on common variants (minor allele frequency: >5%) and a tendency for signals to map to noncoding sequence. Finding suitable answers to these challenges will to a large extent determine continued progress in chipping away at the missing BP heritability. The article by Tomaszewski et al 6 in the present issue of Hypertension provides some intriguing clues as to the best way forward.

Сурет. A, Percentage of variance explained in SBP by the top SNPs of 6 loci identified in 2 large GWA meta-analysis studies. 1,2 B, Percentage of variance explained in DBP by the top SNPs of 9 loci identified in 2 large GWA meta-analysis studies. 1,2

We Should Find the Causal Variants

Tomaszewski et al 6 used a custom-made gene-centric array with >30 000 common and rare SNPs from >2000 candidate loci to genotype 2020 European individuals from 520 nuclear families of the Genetic Regulation of Arterial Pressure of Humans in the Community Study with measures of 24-hour ambulatory BP available. A strong association with 24-hour DBP was found for an SNP (rs13306560) in the MTHFR/CLCN6/NPPB locus and subsequently replicated for clinic DBP in 2 additional cohorts (n>6000). Interestingly, a different SNP in the same locus was identified in the recent GWA studies for clinic BP (Figure). 1,2 However, conditional analysis including both SNPs in the same model suggested that the association with 24-hour DBP is largely driven by the newly identified SNP. Additional bioinformatic analysis indicates a potential direct functional effect of rs13306560 (see also below). This finding illustrates an important limitation of GWA studies: genome-wide significant SNPs often merely tag but do not provide direct information on the causal variants. Fine mapping BP loci through sequencing and/or custom-made chip approaches will be required, not only to get a better estimate of the true (most likely larger) effect on the phenotype, but also to translate those signals to biological function.

We Should No Longer Focus on the Usual Suspects

A total of 105 candidate genes for BP with very good genetic coverage of common variants were present on the array tested by Tomaszewski et al. 6 In spite of this, very little evidence was found for involvement of these most frequently investigated candidate genes for BP, such as those for the sympathetic nervous system and the renin-angiotensin system. These results are in line with those from the recent GWA studies, in which only 2 of the 13 gene loci discovered could have been regarded as candidate gene loci for BP (MTHFR and CYP17A1). 5 Does this mean that we have been betting on the wrong horses for all these years? At least for common variants, the current evidence indeed seems to indicate that we may have more success if we start looking beyond the classic systems of BP regulation. Additional bioinformatic analysis by Tomaszewski et al 6 indicates that signaling pathways that control cell survival may be one promising direction. It may be too early to entirely dismiss our beloved candidate genes, however. Future (meta-analytic) studies with larger sample sizes and exhaustive coverage of both common and more rare variants would be necessary for a more balanced evaluation of the evidence.

Low-Frequency/Rare Variants Are Important

Discoveries of GWA studies are inherently limited to common variants as a result of array design. Rare variants may, therefore, represent an important source of missing heritability. 7 Interestingly, Tomaszewski et al 6 found a significant overrepresentation of rare variants among polymorphisms showing at least nominal association with mean 24-hour BP. These results did not depend on the threshold of rare variant definition (minor allele frequency <5% or minor allele frequency <2%), significance level (П<0.05 or П<0.01), or the phenotype (24-hour SBP or DBP). Although these results indicate that a considerable proportion of its heritability may be explained by low-frequency variants, the overrepresented rare variants did not lead to amino acid substitutions pointing to more subtle regulatory mechanisms. Sample size is of the essence for reliable identification of individual rare variants contributing to BP, emphasizing the need for large meta-analyses of exactly the type of custom-made array used in the current study.

We Should Expand the Search From Clinic to Ambulatory BP

Ambulatory BP monitoring offers a number of advantages over clinic BP readings, including the ability to measure BP in real-life settings, track BP at night, and avoid the “white-coat” phenomenon. The added value of ambulatory BP measurements has been illustrated by studies showing that ambulatory BP is a better predictor of target organ damage and cardiovascular morbidity and mortality than BP measured in the clinic. The higher heritability of mean 24-hour compared with clinic BP measurements 6 suggests that 24-hour BP monitoring may be particularly informative for gene discovery. However, we need to realize that different genes or sets of genes may contribute to BP regulation under different conditions. Our recent studies in twins showed that not only daytime and nighttime BP are influenced by partly different genes, 8 the genes underlying mean 24-hour BP also differ from those for clinic BP to a large extent. 9 Only 45% of the 24-hour SBP heritability and 49% of the 24-hour DBP heritability could be attributed to genes that also influenced clinic levels. These findings indicate that, to take full advantage of ambulatory BP recordings in gene-finding studies, they need to be used in both discovery and replication cohorts. In other words, GWA meta-analyses of ambulatory BP cohorts are urgently needed. Such studies will not only elucidate similarities and differences in genetic architecture with clinic BP but will also provide new insights into the mechanisms of BP regulation at night (including nocturnal BP fall) 8 and in real-life settings.

Beyond the DNA Sequence: Epigenetics

Several epidemiological and clinical peculiarities of essential hypertension, such as the incomplete concordance between monozygotic twins (ranging from 38% to 52%), and its late onset and progressive nature are difficult to fully explain with traditional DNA sequence-based approaches. These observations may point to the involvement of epigenetic factors in hypertension development. Although epigenetics refers to all meiotically and mitotically heritable changes in gene expression that are not coded in the DNA sequence, epigenetic profiles are still affected by genetic variants to a certain extent. For example, DNA sequence variations could make certain loci more or less attractive to methylation. A recent study shows that ≈0.16% of SNPs in the human genome are associated with allele-specific methylation changes. 10 The rs13306560 SNP identified in this study is a good example. It maps to a CpG island in the MTHFR/CLCN6 promoter with evidence of operation of selective pressure throughout mammalian evolution. One possible mechanism by which rs13306560 could, therefore, mediate the association with BP is through differential methylation of the MTHFR/CLCN6 promoter in the 2 alleles. Because methylation changes resulting from variations in DNA sequence can be discovered in genetic studies, they cannot be considered a source of missing heritability. In contrast, vertically transmitted DNA-independent epigenetic markers may contribute to the BP heritability that is still missing. Although it is well known that, during gametogenesis epigenetic reprogramming takes place, which consists of the removal of practically all methylation from the cell, some epigenetic signals can escape this process and are transmitted across generations. Recent advances in automated high-throughput array-based measurement have now made genome-wide methylation studies possible. Such studies are urgently needed not only to identify these epigenetic variants that might contribute to the missing heritability but, perhaps even more importantly, those that mediate differential gene expression resulting from environment influences.

The success of GWA studies has revolutionized the genetics of complex traits and diseases. However, the genetic architecture of BP regulation and essential hypertension has proved even more challenging than other complex traits and diseases, with most of the heritability still missing. 4 As illustrated by Tomaszewski et al, 6 future studies in BP genetics need to both build on and move beyond the successes of GWA studies to make continued progress.

Осы редакциялық мақалада айтылған пікірлер міндетті түрде редакторлардың немесе Америка жүрек қауымдастығының пікірлері емес.


After this review was written, a GWAS of the maize bacterial phyllosphere was published. Wallace т.б. ( 2018 ) sequenced 16S transcripts from 300 maize genotypes grown in a common field environment, and they used these data to estimate dozens of community diversity indices, the relative abundance of hundreds of OTUs, and the representation of thousands of predicted metabolic functions in community metagenomes for each leaf sample. A few percent of the metrics in each of these three categories were heritable, many of which appeared to be driven largely by variation in the abundance of Methylobacteria. Intriguingly, functions related to the metabolism of short-chain carbon molecules were overrepresented, offering the hypothesis that these bacterial metabolic traits may be an important part of the causal link between plant genotype and phyllosphere community composition. However, GWAS identified few significant associations with these traits, and consequently did not reveal which plant genes or traits most strongly influence phyllosphere composition in maize. This study illustrates both the wealth of insight that can be gleaned from GWAS of the phyllosphere, particularly when moving beyond bacterial taxonomy by focusing on metagenomic features, but also the difficulty in uncovering the links between plant genes and phyllosphere community composition in field environments. We eagerly await the future studies that extend the approaches of Horton т.б. ( 2014 ) and Wallace т.б. ( 2018 ) to larger collections of plant genotypes and additional species, more powerful tools for quantifying the taxonomic and functional composition of microbial communities, and powerful multi-trait GWAS methods in hopes of overcoming this challenge.

Авторлар мүдделер қақтығысы жоқ деп мәлімдемейді.

Файл атауы Сипаттама
tpj14170-sup-0001-MethodsS1.docxWord document, 135.1 KB Method S1. Methods used to generate Figure 2 are reported in Methods S1.

Назар аударыңыз: Баспагер авторлар берген кез келген қосымша ақпараттың мазмұны немесе функционалдығы үшін жауапты емес. Кез келген сұраулар (жоғалған мазмұннан басқа) мақаланың сәйкес авторына жіберілу керек.