遗传学与流行病学的关系?遗传流行病学主要用于探讨疾病的发生与什么因素的关系?遗传学和流行病学中的一个重要问题是发现导致疾病的风险因子。这些发现可以帮助我们找到更好的办法来降低疾病的风险,比方说,降低低密度脂蛋白来降低心血管疾病的发病率。然而,确定风险因子和疾病之间的因果关系,而不仅仅是相关性,通常非常困难。所以如何利用MR得到有效的结论就成了国际遗传学和流行病学界的一个热点问题。贺信团队的这项工作在弥补现有MR方法不足上做出了重要的贡献。
编辑| Xi
遗传学和流行病学的一个重要问题是找到导致疾病的危险因素。这些发现可以帮助我们找到更好的方法来降低疾病的风险,例如,降低低密度脂蛋白(LDL)来降低心血管疾病的发病率。
然而,往往很难确定危险因素和疾病之间的因果关系,而不仅仅是相关性。一个著名的例子是,科学界花了几十年才确定吸烟导致肺癌。
近年来,一种新的方法——孟德尔随机化方法(MR)为解决这一问题提供了新的途径。简单来说,假设我们要研究一个可能的危险因素(M)是否会影响一种疾病(Y)。如果我们知道一个与M相关的基因位点(G),我们可以想象根据G的基因型把所有人分成两组,一组中M的水平高于另一组。如果两组之间Y的发生率不同,我们可以大致确定两组之间的差异是由M的差异引起的,这个方法可以简单地推广到有多个遗传位点可以影响M的情况,我们可以利用每个位点对Y的作用和对M的作用:我们可以通过两者的回归分析来估计M是否对Y有影响,以及影响的大小。随着全基因组关联研究(GWAS)的普及,人们很容易获得许多危险因素的遗传位点,MR已经成为一种越来越重要的分析工具。
但MR面临的一个重要问题是,MR有一个很强的假设,即M的遗传位点只能通过M,而不能通过其他途径影响Y。如果这个假设不成立,先生的结论就可能无效。越来越多的研究发现,这种假设往往会被违背。举个简单的例子:假设我们想知道高血压是否会影响糖尿病的风险,我们可以用高血压相关的基因位点做MR,但是,如果两者都受到另一个因素的影响,比如身体质量指数,那么任何一个影响身体质量指数的基因位点都会同时影响血压和糖尿病,传统的MR方法可能会给出假阳性结果。因此,如何利用MR得到有效的结论成为国际遗传学和流行病学的热点问题。
2020年5月25日,芝加哥大学的贺信团队和著名统计遗传学家马修斯蒂芬斯(Matthew Stephens)在《自然遗传学》(Nature Genetics)上发表了一篇文章《解释相关和不相关多态效应USI的孟德尔随机化》。Ng全基因组汇总统计为解决上述问题提供了较好的方法。
何新团队提供的方法3354 Cause(使用汇总效应估计的因果分析)的思路是:如果M确实对Y有因果效应,那么M的任何基因位点的改变都会改变Y,如图(B)所示。另一方面,如果M和Y都受到某种未知因素U的影响,那么一般来说,只有M的一部分遗传位点(影响U的那些)会影响Y,比如图(a)中的那些蓝点。CAUSE基本上是通过估算所有M的多少个基因位点也影响y来决定这两种可能性哪个更符合数据。
图一。原因模型描述
祝贺团队证实,与现有的MR方法相比,CAUSE在模拟实验中大大降低了假阳性率。在对真实数据的分析中,CAUSE也做出了与现有方法不同的发现。一个例子是低密度脂蛋白对糖尿病的影响。大多数现有的方法都报告了积极的结果,CAUSE认为更可能的解释是低密度脂蛋白和糖尿病风险都受到一些其他因素的影响。这一结果可能对我们实际降低糖尿病风险有一定的指导意义。
在另一组研究中,CAUSE分析了血液中各种细胞的数量和相关指标是否会影响免疫疾病的风险。现有的MR方法已经发现了很多可能的假阳性,比如红细胞相关指标对自身免疫性疾病的影响(生物学上没有可能的直接途径)。这些假阳性大多是由原因避免的。
图二。血细胞数量及相关指标对免疫性疾病的MR分析。
2.PLT:血小板,RBC:红细胞,WBC:白细胞。系统性红斑狼疮、IBD和类风湿性关节炎是自身免疫性疾病。过敏:过敏性疾病,asthma:
鉴于越来越多的基于MR的研究工作已经发表-遍布各个领域,如癌症研究、心脏病和精神疾病-如何提供有效和可靠的MR分析已成为当务之急。何新团队的这项工作为弥补现有MR方法的不足做出了重要贡献。
原始链接:
https://doi.org/10.1038/s41588-020-0631-4
制版人:柯