第二节 研究的基本模式及其应用

近年精准医学(precision medicine)的浪潮已经冲击到医学的各个领域,从2003年人类基因组计划完成,到2015年1月美国总统奥巴马宣布启动精准医学计划,其目的是形成综合基因、环境和生活方式等差异而进行疾病的预防和治疗的新型医疗模式,精准医学的产生和发展需要多学科的共同支撑和促进,分子流行病学作为流行病学与分子生物学的交叉学科,被认为是促进精准医学发展的核心力量,因为任何精准的生物学标志的意义必须是基于人群研究获取的,其医学价值必须是经过人群研究考量的,所以合理应用流行病学研究设计的基本模式进行分子流行病学研究是我们未来相当长时间众多领域必须面对和重视的问题。分子流行病学研究的基本模式主要有以下几种。
一、描述性研究
应用描述性研究的方法进行分子流行病学相关问题的研究,主要用现况调查的方法,其研究目的主要是描述群体生物学标志的分布及其与疾病和健康是否存在关联,如以病原体核酸或蛋白为生物学标志进行人群感染状况调查,用免疫学指标进行人群免疫水平的估计,以及依据分子进化相关生物学标志进行传染源追踪和传播途径的判断,测定人群危险因素及保护因素的内暴露水平,进行从暴露到疾病连续过程中生物学标志的测量,估计群体暴露水平和暴露效应,如基因突变、蛋白质异常表达等。有关描述性研究样本量问题,既要考虑满足统计学样本量的估计,还要考虑研究目的、生物学标志测定耗费及其研究意义等,费用昂贵的大样本的人群调查是不可取的。此外,对描述性研究的局限性要予以充分的认识,其研究结果是为生物学标志与疾病和健康的因果关联的分析性研究和实验性研究提供方向和线索,而不能阐明因果关联。其主要用途可考虑如下几个方面:
1.研究一定时间范围内不同人群及不同地区某些生物学标志的分布特征及其差异,了解其形成影响因素。例如,世界范围不同地区人群乙型肝炎病毒(hepatitis B virus, HBV)的基因型有所不同,人乳头瘤病毒的基因型差异也很大。
2.环境外暴露与人群内暴露生物学标志关系的研究。如了解环境重金属污染与暴露人群体内重金属含量以及相关代谢产物的关系。
3.暴露组和暴露组学的研究。近年暴露组(exposome)和暴露组学(exposomics)的研究进展较快,像全基因组关联研究(genome-wide association studies, GWAS)一样,进行暴露组关联研究(exposome-wide association study, EWAS)的目标是研究生命期的多种多类型的暴露与疾病及健康的关联性。
4.暴露相关生物学标志的分布与疾病及健康相关的效应生物学标志的相关性研究。
5.多次现况研究,可选用相关生物学标志评价干预措施对疾病发生危险度的影响及评价干预效果。
6.应用暴露、效应及易感性生物学标志筛选高危人群,发现临床前期个体,使疾病预防关口前移。
Saadatian-Elahi等在欧洲癌症与营养前瞻性多中心研究人群中,进行了血浆磷脂脂肪酸谱及其与食物摄入相关性的横断面研究,研究者对16个中心的3 000名研究对象进行了调查,血浆脂肪酸用毛细管气相色谱法进行评估并分析,同时完成了24h的膳食回顾和膳食调查,以探索血浆磷脂脂肪酸是否为膳食摄入量的合适生物学标志。结果显示,血浆脂肪酸的最重要的决定因素是区域,区域间的差异主要是由于食物摄入量不同。研究还发现鱼类摄入与长链n-3多不饱和脂肪酸、橄榄油和脂肪酸、人造黄油和反式脂肪酸之间存在高度正生态学相关性。研究表明,特定的血浆磷脂脂肪酸是调查人群中食物摄入的合适生物标志物。这项研究提示饮食脂肪酸与相关癌症和其他慢性疾病关系值得进一步关注。
另一项研究分析了从NCBI基因库中的标准HBV基因组核酸序列383条序列(截至2014年1月),在提供HBV基因组核酸序列的比利时、德国、波兰、俄罗斯、土耳其等16个欧洲国家中,A型及D型分别占39.16%和51.96%,B、C、E、F和G五个型的HBV基因组核酸序列仅占30.89%。从GenBank中检索到320例中国患者的HBV分离株,HBV基因组核酸序列中B基因型占25.6%,C型占74.4%,可以看出,中国HBV基因型与欧洲人群明显不同。有学者进一步分析,HBV各基因型CpG岛的分布、长度和遗传特性可能影响其甲基化状态,可能进一步影响HBV基因表达的调控,进而导致不同的感染结局。
二、筛检
近年,有关生物学标志作为筛检试验价值的研究方兴未艾,一方面生物学标志研究提供了认识疾病和健康的有力武器,另一方面,疾病预防、治疗、控制及健康促进工作迫切需要生物学标志在疾病早期诊断、临床类型确定、高危人群筛选等方面承担重要角色。
有学者探讨环状微小RNA-126(miR-126)作为筛查早期糖尿病和初诊2型糖尿病(type 2 diabetes mellitus, T2DM)患者生物学标志的意义。该研究选择了82例糖耐量受损(impaired glucose tolerance, IGT),75例空腹血糖受损(impaired fasting glucose, IFG),160例新诊断的T2DM患者和138例健康人,采用荧光定量PCR法检测血清中miR-126的表达。结果表明,IGT/IFG组和T2DM患者血清miR-126含量明显低于健康对照组,治疗六个月后(IGT/IFG患者饮食控制与运动,T2DM患者胰岛素加饮食控制与运动),血清中miR-126显著升高( P<0.05)。ROC曲线分析显示,单独用miR-126这个因素区分T2DM患者与健康对照组时,曲线下面积为0.792(95%CI,0.707~0.877, P<0.01),对新发T2DM患者进行ROC分析,曲线下面积为0.893(0.838~0.947, P<0.05)。研究结果表明血清miR-126用于糖尿病前期和糖尿病筛检的生物学标志有一定流行病学意义。
Ruizgarcia等学者对乳腺癌筛查的血液生物标志物进行了研究,研究对象为健康妇女(119例)和早期乳腺癌患者(133例),用酶联免疫吸附试验测定血清中Fibronectin 1和CXCL9蛋白含量,研究分析了两项指标不同界值在筛查乳腺癌的价值,结果显示,当纤维连接蛋白1临界值定为200μg/ml时,灵敏度和特异度分别为43%和98%,其阳性预测值为97%。当CXCL9蛋白选择1 000pg/ml为临界值时,灵敏度为27%,特异度为90%,阳性预测值为76%。采用联合试验得出灵敏度为53%、特异性为98%。在乳腺癌筛查试验的评价做了有益的探索。
三、分析性研究
(一)病例对照研究
经典的病例对照研究是按照目标人群中是否患有所研究疾病的状态分为病例组和对照组,分别调查其既往暴露于某个(或某些)因素的情况及程度,并进行比较,从而判断疾病与暴露因素之间是否存在关联以及关联程度大小。病例对照研究具有样本量相对小、容易实施、研究时间短、出结果快、人力物力财力耗费相对小等优点,以及可定量的、稳定的生物学标志对暴露、疾病类型等精确界定等方面的优势,这些优点和优势使得病例对照研究成为分子流行病学最为常用的研究方法。而且,设计严谨实施严格的病例对照研究的结论可靠,近些年进行的GWAS是基于病例对照研究的分子流行病学研究,正在兴起的暴露组关联研究(EWAS)也将以病例对照研究为主要研究类型,病例对照的研究方法受到越来越多领域的关注。以下几点特征应予了解。
1.生物学标志使“病例”的划分更为精细
经典的病例对照研究将患有研究疾病的个体划分到病例组,在分子流行病学中,以某种(些)生物学标志为特征,可以将罹患某病的病例分为不同的亚组,如依据某基因突变与否分为突变型和未突变型,分析比较两种亚型环境因素和遗传因素的病因学意义、治疗效果的影响、预后的作用等。例如,根据其 TP53突变与否,可将肺癌、食管癌、肠癌患者分为 TP53突变组和 TP53未突变组,更精细地分析人口学特征、职业暴露、行为生活方式、临床相关因素与 TP53突变型和未突变型的关联。Suzuri等通过多元logistic回归模型分析发现,非小细胞型肺癌 TP53突变组与终生吸烟有更强的关联,表明戒烟可能对预防这一类型的肺癌有更好的效果。
另外,可以将某种生物学标志作为发生某种医学事件的指标,将阳性者作为病例组,阴性者作为对照组,进行病例对照研究,探讨某医学事件发生的影响因素。
2.生物学标志使暴露的测量更为精准
在病例对照研究中,如何能精准测量研究对象的暴露问题,一直困扰着研究者,一方面是既往暴露的真实程度的求证,一般而言,如果既往暴露与疾病发生有关,可以测查内暴露标志和生物有效暴露标志以及早期生物学效应标志,目前生物学技术为这方面的研究提供了有效手段和思路,如果我们能够追溯到从外暴露至生物有效暴露的“足迹”,病例对照研究中暴露的真实性就会得到客观的估计,当然这个问题本身的研究就是非常有意义的。另一方面,有害物质代谢水平的群体差异是造成罹患疾病风险千差万别的原因,非常典型的例子就是烟草的代谢,某些遗传因素决定个体间代谢能力的差别,同一暴露水平吸烟者其体内代谢产物可替宁可以相差100倍或更多,如果研究者不仅调查研究对象的吸烟量,而且测查生物学标志可替宁的体内水平来反应烟草暴露的危害及其代谢能力,以及与肺癌及其他烟草暴露相关疾病的关系,那么对有害因素暴露与疾病关系的认识就会深刻得多。
在病例对照研究中,在肯定生物学标志使暴露的测量更为精准同时,要认识暴露相关生物学标志测量的局限性。致病因素暴露到疾病发生要经历或长或短的潜伏期或潜隐期,有害物质的致病机制非常复杂,有害物质在体内存留时间和代谢过程及其生物学标志变化也非常复杂,应该至少考虑以下两点:
(1)要广泛查阅多学科文献或进行专项研究,了解生物学标志本身的特性对暴露标志测量结果的影响,知晓其分子特性、时相特性及动态变化特性、个体间及群组间变异特性、测量的敏感性和特异性、与疾病或医学事件关联的可能性、不同生物材料的分布特性等。一定要领悟病例对照研究暴露与疾病时序关系分析的局限性,暴露生物学标志测量阴性时不能否定既往有害因素暴露对疾病产生影响,测量阳性时不能完全肯定该生物学标志测量结果是既往暴露的客观反映,要具体到每一个生物学标志的特征及环境暴露情况去判断,科学地、客观地分析暴露标志与疾病的关系。
(2)要考虑疾病对暴露生物学标志的影响,以现患病例为研究对象进行病例对照研究时,必须考虑罹患疾病后研究对象行为生活方式及其他因素暴露状态改变对病因学研究的影响,这些暴露状态的改变同时改变了暴露标志,特别是对于短半衰期的暴露标志,所以现患病例和新发病例生物学标志的差异是必须考虑的,一方面研究者尽可能收集新发病例,另一方面要特别重视调查相关因素暴露状态变化的调查,宏观和微观结合,正确评价暴露和暴露标志对疾病发生的影响。
3.注重因素间交互作用的研究
交互作用是暴露因素间共同作用大于一种因素单独作用的现象,用病例对照研究筛选危险因素的基础上,进行因素间的交互作用分析,以探讨环境-环境因素、环境-遗传因素以及遗传-遗传因素间的交互作用,这已经成为病因学研究不可或缺的内容。肝细胞性肝癌(hepatocellular carcinoma, HCC)是世界范围内因癌症死亡的第二大原因,我国学者用病例对照研究的方法探讨HBV的基因突变、HLA基因多态性(single nucleotide polymorphisms, SNPs)及其交互作用与HCC风险的关系。研究者选取1 507例由于HBV感染引起的肝癌患者为病例组,同时选取1 560例HBV携带者作为对照组。检测HBV基因型、基因突变及HLA-DQ/DR SNPs(rs9272105和rs9275319)。结果显示,HBV基因型C型所占比例在病例组明显高于对照组(80.6%vs34.4%),此外,在EnhⅡ/BCP/PC区11个HBV突变热点与肝癌发病风险显著相关。HLA-DQ/DR rs9272105与HBV基因型或突变之间存在交互作用( P<0.05),而rs9275319与HBV基因型或突变之间未显示交互作用。通过逐步logistic回归分析,HBV基因型,HBV11个位点的突变,HLA-DQ/DR(rs9272105和rs9275319),以及A1752G与rs9272105的交互作用最终进入了肝癌的预测模型。此项研究将HBV基因型、基因突变与HLA-DQ/DR SNPs作为生物标志物,对HBV持续感染发生肝癌的风险进行了有益的探讨,当然应通过大型前瞻性研究进一步验证模型的预测价值。
4.遗传易感性及环境与遗传因素交互作用研究
遗传易感性制约着从暴露到疾病的全过程,遗传易感性大多是与生俱来的具有家族特点的遗传特征决定的,一般而言家族遗传特征是终身不变的,这些稳定的暴露可以克服病例对照研究暴露与疾病时序关系不清的局限性,所以用病例对照研究方法进行遗传易感性研究具有明显优势。详见本章遗传流行病学部分。
5.突发公共卫生事件的成因分析
将突发事件现有病例作为病例组,未发病者作为对照组,在生物材料中寻找生物、物理、化学等方面相关致病因素的生物学标志,快速分析,为寻找致病因素并平息突发公共卫生事件起着至关重要的作用。例如,2015新生儿“小头畸形”在巴西流行,小头畸形是一种新生儿头部发育明显小于同龄婴儿的表现,在孕期胎儿头颅随着大脑发育而变大,由于在孕期或出生后,大脑发育停止导致孩子的头颅小于正常婴儿(头颅小于平均值减去其2倍标准差即可诊断为小头畸形)。2016年世界卫生组织将该种疾病确定为紧急公共卫生事件,因此研究新生儿“小头畸形”的病因具有重要的公共卫生意义。2016年1~5月巴西寨卡病毒感染与小头畸形间的关系的病例对照研究初步报告在Lancet Infectious Diseases连续发表,研究者将2016年1~5月在巴西8所公立医院选取研究对象进行病例对照研究,病例组为先天性“小头畸形”的新生儿,对照组为无先天性“小头畸形”的新生儿,通过出生日期和出生地点进行1∶2匹配。通过RT-PCR对病例、对照组的血清和病例组的脑脊液进行寨卡病毒检测。运用病毒蚀斑减少中和试验的检测方法检测母亲血清中寨卡病毒和登革热病毒。结果显示,病例组和对照组分别有41%(13/32)和0%(0/62)经实验室确认感染寨卡病毒。病例组中寨卡病毒的感染率明显高于对照组,表明新生儿“小头畸形”病例的发生与寨卡病毒暴发流行具有相关性。该研究又通过扩大样本量(病例组91例,对照组173例),并且增加其他可能造成新生儿“小头畸形”的因素(怀孕期间接触农药、接种疫苗)来进一步研究新生儿“小头畸形”与寨卡病毒的相关性。结果显示,新生儿“小头畸形”病例的发生与寨卡病毒暴发流行具有明显关联,怀孕期间接触农药、接种疫苗与新生儿“小头畸形”无关。
(二)队列研究
队列研究是论证强度优于病例对照研究的分析性研究方法,但因其所需样本量大,生物材料收集时间长,检测费用昂贵,限制了队列研究在分子流行病学研究中的应用,但队列研究具有前因后果时序关系明确的明显优势,医学界对队列研究结论的认可程度受到空前重视,另外,随着近年生物学技术测试成本的降低,使得样本量较大的队列研究的可行性增加,因此,队列研究在分子流行病研究中应用将越来越广泛。队列研究早期用于传染病的研究较多,如John Snow著名的霍乱调查;工业革命的兴起之后,职业人群的健康问题的队列研究,如1929年1 000名镍精炼工人10年的随访,发现其肺癌、鼻部肿瘤发病率增加。20世纪中叶,为适应人类疾病谱变化,慢性非传染性疾病研究成为队列研究的重要内容,如著名的英国皇家医学会医生Doll和Hill关于吸烟与肺癌关系的研究,“吸烟有害健康”写上了烟盒。美国国立卫生研究院(NIH)旗下的国立心肺血液研究所始于1948年的Framingham Heart Study(FHS)是队列研究的典范,从两代研究对象中得出了很有趣的结果,第一代为1948年时全镇无心血管及其他重要疾病之5 209名30~60岁居民,每2年随访一次,第二代研究对象是该镇的第一代研究对象之子女及其配偶共5 124人,每3年随访一次。由于FHS的特殊设计,它拥有世界上最多,观察时间最长人群的家族资料,便于比较亲代与子代在同年龄疾病谱的异同,提示可能的遗传基础。经30余年观察已明确生活方式及传统危险因素仅解释心血管疾病的部分原因,另一些答案涉及遗传因素,FHS发现ACE基因的变异可能对男性高血压有重要影响,FHS第二代研究采用分子链接技术检测1 044对同胞(兄弟姊妹),发现30%男女具有(ACE)基因变异,男性具有ACE基因变异者高血压危险增加59%,但与女性无关,现正进一步采用更精细的染色体拼图进行精确基因定位。
世界范围大型队列研究有儿童发展研究(NCDS,1958年始)、女性最大的队列研究护士健康研究(NHS,1976年始)、非洲最大的队列研究(BTH,1990年始)、挪威母亲和儿童队列研究(Moba,1999年始)、欧洲膳食和癌症前瞻性队列研究(EPIC,1993年始)、英国出生队列研究(BCS,1946年始)、中国慢性病前瞻性研究(CKB,2004年始)等。
队列研究从特殊人群转向一般人群,从20世纪到21世纪,有关队列研究的设计和应用有一些扩展,暴露因素由较为单一的暴露因素向多种暴露因素扩展,观察结局由单一结局向多种结局延伸,研究对象从职业人群、单一暴露人群向不同人口学特征人群、自然人群、罹患疾病人群方向跨越。并且以信息关联的方式获取结局信息,使用个体唯一性标识(身份证号、医疗或社会保险号、驾照证号等),从疾病登记等卫生信息系统,门诊、出入院等医院信息系统,以及医疗保险赔付等健康相关信息系统中提取研究对象的发病、就诊、死亡信息。英国的BCS及我国CKB均采取此种方式进行结局追踪。
2017年美国医学会杂志JAMA报道了 BRCA1BRCA2基因突变携带者罹患乳腺癌、卵巢癌及对侧乳腺癌风险为题的研究。在1997—2011年期间,这项国际性的 BRCA1/ 2基因携带者队列研究共收集6 036名 BRCA1和3 820名 BRCA2基因突变的女性携带者,其中5 046名携带者未出现目标结局,有4 810名携带者出现乳腺癌或卵巢癌,绝大多数的研究对象来源于英国、荷兰及法国等国家的大型队列研究,截至2013年12月,平均随访周期为5年。主要结局指标为年发病率,标化发病率,以及乳腺癌、卵巢癌和对侧乳腺癌的累积发病风险。随访研究对象到80岁时, BRCA1基因突变携带者乳腺癌的累积发病率为72%(95%CI,65%~79%), BRCA2基因突变携带者乳腺癌的累积发病率为69%(95%CI,61%~77%); BRCA1基因突变携带者卵巢癌的累积发病率为44%(95%CI,36%~53%), BRCA2基因突变携带者卵巢癌的累积发病率为17%(95%CI,11%~25%)。乳腺癌诊断20年后 BRCA1基因突变携带者对侧乳腺癌的发病率为40%(95%CI,35%~45%), BRCA2基因突变携带者对侧乳腺癌的发病率为26%(95%CI,20%~33%)。乳腺癌的发生风险随着一级亲属和二级亲属的家族乳腺癌史人数的增加而增加。此项队列研究是高危人群的前瞻性观察,研究结果为评估 BRCA1BRCA2基因突变携带者癌症发病率提供了很好的依据,并证明了家族癌症史对癌症发生的潜在影响,且对基因突变位点进行了风险估计。
四、分析性研究的衍生类型
将病例对照研究和队列研究结合起来,衍生出了一些新型的分析性研究方法,如巢式病例对照研究、病例-病例研究、病例-队列研究等,这些研究方法应用于分子流行病学研究,取得了许多卓有成效的工作。这些研究方法的优点是能够从暴露观察到疾病发生,资料收集与生物标本采取均在发病前,故因果关系的时间顺序明确,而且没有回忆偏倚,所获资料真实可靠,研究结果论证强度高,而且病例与对照都在一个研究队列中选择,故其选择偏倚、信息偏倚、混杂偏倚中诸多来源的偏倚可得到较好的控制和客观的估价,其研究设计兼具病例对照研究与队列研究的优点,而克服了它们的局限性,研究效率高,是值得提倡的研究方法。特别适合于生物学标志测定耗费大的分子流行病学研究。
(一)巢式病例对照研究
Miettinen(1982)提出了一种将队列研究与病例对照研究相结合的方法,命名为巢式病例对照研究。研究开始时,按队列研究设计进行,如可选择某一社区人群,某一职业人群等作为研究队列,收集暴露和疾病的有关资料,收集生物材料,随访观察研究疾病的病例出现,并达到所设计的样本,将这些病例作为病例组,并在此队列中用随机的方法选择非该病病人作为对照组,进行病例对照研究,探讨暴露相关生物学标志与疾病或效应生物学标志的关系,这种病例对照研究称为巢式病例对照研究(nested case-control study)。
营养状况与癌症的关系一直是研究者关心的问题,B族维生素的浓度和与一碳代谢有关的因素与肺癌的发生风险是否存在关联?Fanidi等在欧洲癌症和营养研究的前瞻性调查的20个队列中,设计了一项巢式病例对照研究,选取队列中5 364例新发肺癌患者作为病例组,选取同一队列5 364例对照,对照与病例分别按年龄、性别和吸烟状况进行1∶1匹配,测定了研究对象的血清中维生素B 6、叶酸和甲硫氨酸浓度,以及近期烟草暴露指标可替宁的浓度,用条件logistic回归模型分析这些生物学标志与肺癌风险之间的关系。结果显示:较高浓度维生素B 6(>62.51nmol/L)和叶酸(>34.97nmol/L)可降低罹患肺癌的风险(OR=0.88,95%CI:0.78~1.00;OR=0.86,95%CI:0.74~0.99)。在男性人群和吸烟者中,较高的维生素B 6(>62.51nmol/L)和叶酸(>34.97nmol/L)浓度与肺癌存在关联。男性人群中,较高浓度的维生素B 6(>62.51nmol/L)和叶酸(>34.97nmol/L)可以降低患肺癌的风险(OR=0.74,95%CI:0.62~0.89;OR=0.75,95%CI:0.61~0.93)。吸烟者中,较高浓度维生素B 6(>62.51nmol/L)和叶酸(>34.97nmol/L)亦可以降低患肺癌的风险(OR=0.78,95%CI:0.67~0.91;OR=0.87,95%CI:0.73~1.03)。但未见甲硫氨酸浓度与肺癌发生风险有关。当然,对于烟草暴露干扰作用,还需要进一步研究。
脂肪酸的摄入被认为可增加乳腺癌的发生风险,但基于膳食调查的流行病学研究仍然持有争议。Chajes等为了评估脂肪酸与乳腺癌发病风险的关系,基于上述欧洲癌症和营养研究前瞻性调查进行了巢式病例对照研究,使用气相色谱法测定2 982例乳腺癌病例和与其匹配的2 982例对照的血浆磷脂中的六十种脂肪酸含量,以此作为内暴露标志,采用条件logistic回归模型估计脂肪酸水平对乳腺癌相对危险度的影响,并对雌激素受体(ER)和孕激素受体在肿瘤中的表达进行亚组分析。结果显示,高水平的棕榈酸和高饱和脂肪指数(DI16)作为脂肪生成的生物学标志,可显著地增加乳腺癌的发生风险。工业反式脂肪酸的水平与ER -(ER阴性)肿瘤呈正相关,然而未发现与ER +(ER阳性)肿瘤有关。未发现n-3多不饱和脂肪酸与乳腺癌的发生风险相关。研究结果表明,通过增加棕榈酸的合成来增加脂肪生成,可能是乳腺肿瘤发生相关代谢途径,膳食反式脂肪酸可能会增加患ER -乳腺癌的风险。多项研究表明工业反式脂肪酸与部分肿瘤及其他疾病相关,现已禁用。利用欧洲癌症和营养研究前瞻性调查队列,研究者进行了多项营养与肿瘤的巢式病例对照研究,另外,还有一些研究内容的扩展,比如探讨了炎症生物标记与罹患乳腺癌的风险等。
(二)病例-病例研究
在病例对照研究的病例组中,临床类型可以不同,如脑卒中有出血型和缺血型,冠心病有心梗型和无心梗型,而在同一种疾病患者中,生物学标志往往也是不均一的,即部分病例有某种生物学标志,而其余的则没有。将不同的临床类型或具有某种生物学标志的这些病例与无相关标志的病例,按病例对照研究的方式进行研究,以探讨疾病不同类型特异的危险因素及生物学标志,进行深入的疾病病因、诊断、治疗及预后的研究,称为病例-病例研究(case-case study,又称case-only study)。
有学者采用病例-病例研究对前列腺癌临床特征及预后特点进行了研究,799例研究对象中313例患者死于前列腺癌,486例为低危局限性前列腺癌患者,对所有研究对象 ATMBRCA1/ 2基因DNA进行了测序,分别用Fisher精确检验和Cox回归分析突变携带率及其对致死性前列腺癌的影响。结果显示,致死性前列腺癌患者中 BRCA1/ 2ATM突变携带率(6.07%)显著高于局部前列腺癌患者(1.44%)。生存分析调整了种族,年龄,前列腺特异性抗原和诊断时格里森评分后,突变携带者仍然是致死性前列腺癌的一个独立预测因素(HR=2.13,95%:1.24~3.66)。这项研究提示 BRCA1/ 2ATM基因突变状态可区分致死和局限性前列腺癌,并与死亡年龄提前和生存时间缩短有关。
乳腺癌亚型在临床表现上是异质性的,然而这种异质性的影响因素尚不清楚。为评价乳腺癌亚型的相关因素的差异,研究者用病例-病例研究的方法,对韩国首尔3 058例乳腺癌患者进行了分析,根据激素受体(HR)和人类表皮生长因子受体2(HER2)状态对肿瘤亚型进行分类。采用多元有序分类logistic回归模型调整年龄和招募中心后比较各亚型的影响因素的差异。按照HR和HER2分类,可分为四个临床类型,分别为HR +HER2 -(HR阳性,HER2阴性)、HR +HER2 +、HR -HER2 +和HR -HER2 -,构成比为56.0%、13.5%、13.9%及16.6%。各肿瘤亚型之间在年龄、绝经状况、初潮年龄、子女数、年龄、第一次足月妊娠年龄,母乳喂养时间和内源性雌激素暴露时间上有显著性差异( P<0.05)。与HR +HER2 -病人相比,其他亚型的患者表现出子女数更多,初潮年龄较早,第一次足月妊娠年龄延迟和内源性雌激素暴露时间较长,HR -HER2 +病人肥胖者居多,而HR -HER2 -亚型是年轻者居多,肥胖比例更大。提示年龄、体质指数及生殖因素与乳腺癌亚型差异相关。
(三)病例-队列研究
病例-队列研究(case-cohort study)开始时在队列中按一定比例随机抽样选出具有代表性的样本作为对照组,观察结束时将队列中出现的所研究疾病的全部病例作为病例组,与上述随机抽样出来的对照组进行比较。上述研究类型是病例对照研究和队列研究的延伸。在探讨遗传因素和环境因素相互作用的分子流行病学研究中有一定优势。
关于饱和脂肪酸和2型糖尿病发病之间的关系存在相互矛盾的证据。研究者在欧洲癌症与营养学研究-互动项目(the European Prospective Investigation into Cancer and Nutrition, EPIC-InterAct)参与者中采用病例-队列研究方法探讨个体血浆磷脂饱和脂肪酸和2型糖尿病发病之间的关联。此病例-队列研究包括12 403例确诊的2型糖尿病发病者作为病例,从340 234欧洲参与者中选择16 154人的代表性子队列作为对照,血浆磷脂中饱和脂肪酸用气相色谱法测量。采用Prentice-加权Cox回归对每类饱和脂肪酸的标准差与新发2型糖尿病的关联进行了风险比估计,并采用随机效应meta分析汇总我们的发现。结果显示饱和脂肪酸占血浆磷脂脂肪酸总量的46%。调整分析,不同饱和脂肪酸与2型糖尿病发病存在不同方向的关联。偶链饱和脂肪酸与2型糖尿病发病呈正相关,奇链饱和脂肪酸与2型糖尿病呈负相关,且研究结果敏感性分析都很稳定。研究结论提示,不同血浆磷脂饱和脂肪酸与2型糖尿病发病存在不同方向的关联,表明饱和脂肪酸在2型糖尿病发病中的作用并不一致,因此,应强调识别这些脂肪酸亚型的重要性。
五、实验性研究
实验性研究的论证强度优于观察性研究,主要用于疫苗效果、疾病预防干预措施效果、临床治疗效果及预后干预作用的评价及其机制的研究等,在分子流行病学研究中,干预前后结局事件及相关生物学标志的变化可使研究者获得更为精准的干预效果的生物学信息,因而是效果评价的主要设计模式。
登革热是一种虫媒传染病,人群普遍易感,免疫预防对于所有年龄段的人群预防登革热感染都是非常重要的。S á ez-Lloren 2017年在Lancet Infectious Diseases杂志报道了四价登革热疫苗(tetravalent dengue vaccine, TDV)的免疫原性和保护效果。随访时间为18个月,研究对象为多米尼加共和国、巴拿马和菲律宾三个地区2~17岁儿童,研究设计为多中心、年龄分层随机化分组、双盲、安慰剂对照实验性研究,研究期间进行七次随访,疫苗干预效应的生物学标志为血清特异性抗体的几何平均滴度,即疫苗干预的免疫学效果,其流行病学效果及安全性评价指标为病毒学确证的登革热病毒感染率及疫苗接种不良事件发生率。研究观察时间为18个月,期间所有接种TDV抗体滴度均持续上升,接种one-dose和two-dose者抗体平均几何滴度差异无显著性。接种TDV的受试者中有1.3%感染登革热病毒,显著低于安慰剂接种者4.5%的感染率。结果表明,TDV对于4种血清型的登革热病毒具有良好的免疫学效果和流行病学效果。
2017年Circulation杂志报道一篇题为空气颗粒物暴露和人群应激激素水平的研究,用实验性研究的方法了解健康大学生在低浓度空气颗粒物污染暴露环境下血清代谢物的变化,探讨环境污染暴露状态下人群代谢组的变化及不良健康结局,其研究设计采用随机双盲交叉对照的实验性研究,研究对象为中国上海某高校17个宿舍的55名健康大学生。屋内放置空气净化器作为干预组,放置去除过滤装置的空气净化器作为对照组,17个宿舍随机放置一种空气净化器,9天作为一个研究时段,经12天的洗脱期后,每个宿舍放置另一种空气净化器,再进行为期9天的研究。研究期间,监测每个宿舍的PM2.5浓度,以反映环境空气颗粒物的暴露程度,即外暴露情况,在两次研究阶段末期,收集55名大学生血样,用气相色谱-质谱法和超高效液相色谱-质谱法检测血清中4种氧化应激标志物、6种炎症标志物和3种激素等代谢物作为主要结局指标,即污染物暴露及空气净化器干预的效应指标,另外血压、促肾上腺皮质素释放激素、促肾上腺皮质激素、胰岛素抵抗以及氧化应激和炎症生物学标志物作为次要结局指标。结果显示:干预组的PM2.5平均个人暴露浓度为24.3μg/m 3,低于对照组的53.1μg/m 3。代谢组学分析显示PM2.5高暴露引起氢化可的松和可的松、肾上腺素和去肾上腺素的升高,并且两组葡萄糖、氨基酸、脂肪酸和脂类均有差异。且PM2.5高暴露组的受试对象血压、胰岛素抵抗以及氧化应激和炎症指标均高于PM2.5低暴露人群。该研究说明空气颗粒物暴露会引起机体代谢变化从而对健康造成不利影响。另外,室内空气净化可暂时降低应激激素,但短期空气净化对健康的有利影响维持时间有待研究。
六、分子流行病学与遗传流行病学研究
遗传流行病学是研究与遗传相关的疾病在人群中的分布、发生的原因以及制定预防或控制对策的学科。过去,常常将疾病及健康状态的影响因素归结为遗传因素或环境因素,但随着分子流行病学及相关学科的进展,研究者越来越清楚地认识到,尽管所有致病因素都可以归类为遗传和环境因素两个范畴,然而人类的疾病或健康状态,均是遗传因素和环境因素(包括生物、化学、物理、社会的、行为生活方式的,等等)相互作用的结果。因此,了解一种疾病在多大程度上受遗传或环境因素的影响是非常重要的,因为它与预防和控制这些疾病的对策与措施直接相关。实际上,一些过去认为单纯由遗传因素引起的疾病可能与环境因素有关,一些过去认为完全由环境因素所致的疾病也可能与遗传因素有关,前者如苯丙酮尿症,后者如白喉、脊髓灰质炎等。在不同疾病的发病中,遗传与环境因素所起作用的区别仅是程度不同而已。因此,研究分析疾病病因中遗传因素与环境因素的相对重要性及其相互作用是遗传流行病学研究的重要内容之一,而分子流行病学对遗传流行病学研究产生了积极的推动作用,在遗传因素与环境因素对疾病发生发展影响的深入研究和客观评价中发挥着至关重要的作用。
(一)遗传流行病学研究思路
首先分析所研究的疾病或性状是否表现有家族聚集性或家族相似性,若存在家族聚集性,则该疾病可能与遗传因素有关;如果疾病具有家族聚集性,则应分析形成家族聚集性的原因,即家族聚集性是因为生物学的遗传易感性、病原体的传染还是文化教养遗传的危险因子所造成;如果是生物遗传所致,则应进一步分析其遗传方式,确定其是单基因遗传还是多基因遗传。若为单基因遗传,可采用分离分析法分析其遗传方式,并可通过Hardy-Weinberg平衡定律估计群体中该病的基因及基因型频率;若为多基因遗传,可计算其遗传度,以确定环境和遗传作用在疾病发生过程中的比重,并可进一步通过通径分析等方法找出哪些环境因素是危险因素,哪些是保护因素,为疾病预防提供依据。还可通过复合分离分析判断是否有主基因作用,用连锁分析、关联分析等进行基因定位。如果某种基因在人群中有不同的亚型或呈现基因多态性,并且其亚型或基因多态性与疾病发生有关,可分析该基因多态性或亚型与其他基因和环境的交互作用;提出疾病的预防策略和措施。遗传流行病学研究遗传因素、环境因素以及遗传与环境因素的交互作用在人群疾病发生中的作用,并把研究结论应用到疾病的干预与预防策略和措施中去,从而实现对疾病控制和预防的最终目的。
另外,应该进行相关方法学的深入研究。尽管遗传流行病学已经形成了一套独特的研究方法,但其毕竟是一门相对年轻的科学分支,其研究方法尚有待补充和完善,特别是微观遗传流行病学研究的突破需要设计、测量和分析方法三个方面的协调发展,需要新的更为有效的方法减少假阳性和假阴性的结果和有效合理分析基因与环境以及基因之间的交互作用。
(二)遗传因素的作用方式
遗传因素对疾病作用的主要方式有三种:
1.单基因(致病基因)显性或隐性遗传致病
如16号染色体上连锁的α球蛋白基因突变引起的地中海贫血(thalassemia)。
2.多基因遗传性疾病
通过多对微效应基因的累积作用,并有一定的环境因素参与,即环境因素与遗传因素的交互作用。环境因素也可通过对染色体或基因的作用而改变机体的易感性。如糖尿病,高脂血症。
3.遗传易感性的作用
在相同或相似暴露条件下,不同人的疾病发生概率,病情、病程、转归各异,易感性的差异是其原因之一。例如,恶性肿瘤的遗传易感性相关的因素有DNA修复能力缺陷,染色体缺陷、细胞转化的易感性,癌基因激活、抑癌基因突变,以及某些代谢免疫失调等。
(三)常用的研究类型和分析方法
遗传流行病学是流行病学的分支之一,流行病学的各类研究方法均适用于遗传流行病学研究。但遗传流行病学研究对象常常涉及特殊群体,即有亲缘关系的人群,因而遗传流行病学运用流行病学的基本原理,并借鉴群体遗传学的技术,发展出一系列自身特有的研究方法,家族聚集性分析、系谱分析、双生子分析、养子和半同胞分析、分离分析、遗传平衡定律(Hardy-Weinberg定律)分析、遗传度估计等,目前遗传流行病学的研究重点是确定特定疾病或健康状态的相关基因,研究其在人群中的变异及与其他因素相互作用的机制,因而常常使用到以下分析方法。
1.交互作用分析
交互作用(interaction)是指当两个或两个以上的致病因子共同存在时,其致病作用显著大于或小于这些致病因子单独作用之和。前者称为增效作用(synergism),后者称为拮抗作用(antagonism)。遗传流行病学中的交互作用更多地关注复杂的多基因遗传病中遗传因素、环境因素之间的基因-环境交互作用和基因-基因交互作用。常用的研究方法有病例对照研究、单纯病例研究、病例-双亲对照研究和患病亲属对研究等。常用的统计分析方法有logistic回归模型分析、多因子降维法(multifactor dimensionality reduction, MDR)、组合法(combinatorial methods)、随机森林法(random forests approach, RFA)、集合关联法(set association approach, SAA)、神经网络模型(neural networks)等。
2.综合分离分析
综合分离分析(complex segregation analysis, CSA)是分离分析的扩展,是利用家系资料综合判断某性状遗传方式的一种方法。综合分离分析利用家系资料拟合、比较不同遗传模型,研究某些质量和数量性状在家系中的传递,分离检验多基因中主基因的作用。主基因是指多基因遗传病中除随机性环境因素、非随机性家庭环境因素(教养传递因素)和微效多基因外,那些外显性较高,对于多基因疾病易感性影响较大的基因。综合分离分析不仅可以检验各种复杂遗传模式,还可以同时考虑环境因素,是一种稳定高效的分析方法。
3.连锁分析
连锁分析(linkage analysis)是通过分析在染色体上已知位点的基因(标记基因)和某易感基因(目的基因)的连锁关系,从而将该易感基因在染色体上予以定位的分析方法。连锁是指在染色体上呈线性排列的基因,其在遗传过程中存在共分离现象,即两个或多个基因有共同遗传的趋势,且不同基因在染色体上的距离越近,其共分离趋势越大。连锁分析就是通过寻找与已知位点的标记基因共分离的证据来确定易感基因在染色体上大致位置的过程。由于计算机的协助,该分析方法在与遗传有关的人类疾病易感基因定位研究中得到了广泛应用。
4.关联分析
关联分析(association analysis)是一种直接检验候选基因(candidate gene)是否为疾病相关基因的方法。通过连锁分析所得到的染色体区域通常会包括许多已经确定的基因,而这些基因中可能就有正在寻找的某疾病的基因,这些基因称为候选基因。传统的连锁分析在检验微效基因的作用时效果较差,而关联研究效果更好。关联研究的方法主要有两种,一种是以人群为基础的相关性分析法,即选择无血缘关系的人群作为研究对象,通过比较病例组与对照组某个位点的某等位基因的出现频率,来确定该等位基因是否与疾病相关;另一种是以家系为基础的相关性分析法,即以父母或同胞为对照,从而匹配与患者遗传学背景不同而导致的混杂。其方法很多,包括病例-双亲研究、受累同胞对研究以及传递不平衡检验(transmission disequilibrium test, TDT)等。
5.全基因组关联研究
全基因组关联研究(genome-wide association studies, GWAS)是指在全基因组层面上,开展多中心、大样本、反复验证的基因与疾病的关联研究,全面揭示疾病发生、发展及治疗相关的遗传基因。因此,全基因组关联研究属于微观遗传流行病学研究方法的范畴。在单核苷酸多态性成功应用之前,人们都是利用微卫星遗传标记进行研究;在人类基因组计划与人类基因组单体型图计划完成后,单核苷酸多态性成为第3代遗传标志,高密度的单核苷酸多态性位点,为全基因组关联研究提供了可能。我国的全基因组关联研究虽然起步较晚,但进展较快,已成功地发现了银屑病、系统性红斑狼疮、麻风、白癜风、食管癌等数十种与汉族人相关的复杂疾病的易感基因。
基因突变与癌症易感性的研究是遗传流行病学的热点话题,癌症的形成与发展被一些启动基因上的关键突变所启动,癌症基因图谱(the cancer genome atlas, TCGA)工程通过高通量测序技术结合生物信息学分析,已经证实了一系列可能与不同癌症病因学相关的体细胞突变。有学者对TCGA证实的显著突变基因(significant mutant genes, SMGs)与肺癌风险间的关系进行了探讨,综合性地评估了被TCGA证实的位于127个SMGs上的1 655个被标记的SNP,通过大型病例对照研究检测它们与肺癌危险度的相关性,进行了两次病例对照研究,首先用Anderson(安德森)癌症研究中心1 656例病例与1 486例对照进行初筛,然后用dbGaP数据平台上5 699例病例与5 815例对照的GWAS数据进行验证,后续还进行相应的功能学效应、突变频率及相关通路分析。结果显示,8个显著突变基因中的11个SNPs与肺癌危险相关,且其中8个SNPs显著相关。 PPP2R1A基因的rs10412613位点基因突变与肺癌发生风险有关,G等位基因与肺癌的低发生风险相关。分层分析显示,在诊断年龄较早且不吸烟的人群中, PPP2R1A基因rs10412613位点突变与肺癌风险显示更强的相关性。结论提出了一些与肺癌风险相关的SMGs上的新型基因突变,可能对阐明参与肺癌发展的复杂生物网络有所帮助。
Nature Reviews Genetics介绍了一项研究,通过双胞胎转录组测序分析发现基因与基因及基因与环境因素相互作用对系统性红斑狼疮(SLE)的影响,既往的研究显示,等位基因特异性表达(allele-specific expression, ASE)可能是由顺式基因( cis)的变异导致的,而此项有关双胞胎研究发现,转录遗传与环境因素在ASE中同样发挥作用。研究对象为Twins UK队列中的400对女性双胞胎,对其脂肪、皮肤、血液和类淋巴母细胞系样本进行mRNAs测序,通过建立一个ASE的定量测量方法并利用双胞胎结构体,对ASE变异是否是由基因因素导致进行详细分析,通过分析同卵与异卵双胞胎之间明确的ASE定量表型来确定基因与环境因素对ASE的贡献。研究结果令人兴奋,将近一半ASE遗传度是由一个共同的顺式( cis)表达数量性状基因座决定的,提示ASE的出现除了主要是由顺式基因( cis)变异决定外,也受基因间相互作用及环境因素的影响。进一步分析发现,39%~49% ASE的变异是由于基因与基因及基因与环境的相互作用导致,因为部分研究对象中基因与环境的相互作用同样在对其脂肪组织与类淋巴细胞系分析中被证实,比如,与编码脂肪组织相关的一个受饮食与锻炼影响的蛋白ADIPOQ的表达被证实依赖于一个SNP与相关环境因素间的相互作用。由此得出结论,ASE的形成需要顺式基因( cis)的变异,但是ASE效应的大小还受转录遗传及环境因素与顺式基因( cis)变异间的相互作用调节。
七、分子流行病学与临床流行病学研究
临床流行病学(clinical epidemiology)是流行病学的重要分支,是20世纪30年代由耶鲁大学John Paul教授提出的,临床流行病学旨在从群体水平进行临床相关问题的研究,具有鲜明的流行病学特色,其形成的基础是流行病学群体研究的理念和方法,其研究目标是探讨疾病的病因、诊断、治疗、预后和临床决策的规律,研究对象是患病或发生医学事件相关的群体,而其研究目标的实现是依赖缜密的设计、定量的测量及客观的评价来完成的。近些年来,生物学标志在探讨疾病病因、进行疾病早期诊断及临床亚型诊断、精准治疗、预后评估等方面取得了丰硕的成果,并有着非常广阔的发展空间。分子流行病学作为流行病学的分支,自20世纪70年代问世以来,发展迅猛,对临床流行病学研究产生了巨大的推动作用,在深入研究和客观评价生物学标志及其相关因素的临床意义方面扮演了非常重要的角色。由此,有学者提出了分子临床流行病学。
(一)诊断试验评价
理想的效应生物学标志作为疾病诊断指标具有真实性、可靠性及收益俱佳的特点,但必须用临床流行病学诊断试验评价的方法进行严格的评价,考量多层面因素对疾病发生的作用,可能涉及多个效应生物学标志。以生物学标志为核心研究内容的分子流行病学对临床诊断价值的研究的主要作用可以概括为三点:
1.疾病早期诊断和确认
诊断机体受到环境和遗传因素作用后发生结构或功能改变的核酸或蛋白质,以及与疾病启动、发生及发展过程相关的生物学标志,可以作为临床早期诊断或密切随访观察的生物学标志,包括早期生物效应标志、结构和/或功能改变标志和疾病标志。例如,吸烟导致食管癌组织抑癌基因 TP53序列上的一些特殊部位发生G到T的突变而使其失活,肿瘤发生前的癌前病变,通过局部组织或细胞中可以检测到癌基因或抑癌基因产物。疾病标志往往代表疾病的亚临床阶段或者该标志物本身与疾病密切关联,是非常重要的临床流行病学研究的范畴。外周血液、体液等生物材料中检测得到的效应生物学标志与机体内部特定靶器官的生物学效应标志存在关联,一些疾病生物学标志具有诊断、辅助诊断及病情评估的作用,但是很多该类生物学标志目前的灵敏度和特异度有待提高,尚不能直接作为临床疾病诊断的主要依据。有资料显示,超过60%的肝细胞癌患者得不到有效的治疗,研究者探讨血浆微小RNA作为诊断HBV相关肝癌的生物标志物的诊断价值。选择健康人、慢性乙型肝炎、肝硬化和HBV相关肝癌患者共934例,对血浆microRNA的表达进行了测查。以ROC曲线下面积(AUC)判断准确性。结果显示,miR小组(miR-122、miR-192、miR-21、miR-223、miR-26a、miR-27a和miR-801)在不同疾病进程均有较好的诊断价值,尤其是早期患者。它还能鉴别肝癌与健康人(AUC=0.941),乙肝患者(AUC=0.842)以及肝硬化病人(AUC=0.884)。这项研究发现了一种在早期肝癌诊断中具有重要临床价值的血浆microRNA。
2.确定疾病的临床亚型及疾病危重程度
肺癌的分子分型取得了许多进展,基因组测序研究发现,肺癌的三种主要病理类型腺癌、鳞癌和小细胞肺癌的体细胞基因突变谱差别很大。比如,腺癌具有临床意义的基因突变有表皮生长因子受体(EGFR)基因突变、间变性淋巴瘤激酶(ALK)重排、突变或扩增以及 TP53K-RAS为主的其他基因突变。2017年New England Journal of Medicine报道慢性支气管炎的生物学标志的研究,研究者对917名患者进行问卷调查,胸部CT、肺功能和痰液检查,质谱定量分析部分病例呼吸道分泌物黏蛋白MUC5AC和MUC5B。结果表明,慢性支气管炎患者痰中黏蛋白浓度的增加与痰液的产生和疾病的严重程度有关,提示痰中总黏液浓度作为诊断慢性支气管炎的生物标记物和治疗靶点的研究是有意义的。
3.建立疾病诊断模型
诊断模型不是对单个生物学标志的评价,而是对一系列与疾病诊断相关的变量(临床表现、流行病学资料、实验室检查、生物学标志等)进行综合评估,建立多因素疾病诊断的数学模型,模型建立之后需要进行临床诊断价值的评价,并反复修订,以建立目前条件下的最佳模型,一个成熟的模型可以成为计算机辅助诊断系统。建立模型的常用方法包括回归分析、判别分析、聚类分析、主成分分析、人工神经网络分析、模糊数学分析、生物信息学分析等。国内外有学者进行了相关研究,El-Solh等将人工神经网络(artificial neural network, ANN)应用于活动性肺结核的诊断,训练集中ANN诊断的灵敏度为100%,特异度为72%,医生诊断的灵敏度为47%,特异度为75%,结果显示ANN诊断活动性肺结核的能力高于临床医生。
(二)临床疗效评价
临床疗效研究是临床医学的重要研究内容,分子流行病学研究注重临床医学转化,为临床疗效评价注入了新的内涵,在考虑传统的临床疗效评价原则的基础上,以下几点在临床疗效评价设计中需要考虑。
1.基于生物学标志及相关因素划分疾病类型,关注不同亚组的临床疗效
传统的疗效评价主要关注药物和治疗方案对整体受试人群或所有临床类型患者的平均效益或疗效,随着临床医学、系统生物学、系统流行病学、分子流行病学的快速发展,在临床疗效评价中深刻认识和实施精准医学已经成为可能,临床实践中已经逐渐明确某一疾病异质性与临床疗效密切相关,观察到并不是某一种疾病所有患者都能从某个新药或治疗方案中获益,往往是具有某个或某些特征的亚组患者能够显著获益,其他患者获益很小或无明显疗效,而且还需承担一定的治疗风险,患者的某个或某些特征可以是人口学特征及相关因素,更多地体现在生物学标志所指示的基因、蛋白或基因组、蛋白组、代谢组、表观组等组学特征的不同,以及所表现的病理生理学、组织学、遗传学的特征。因此,必须探索患者群体特征来研究临床疗效,基于生物学标志及相关因素划分疾病类型,研究疾病不同亚组的临床疗效,发现获益较大的优势亚组,同时,避免获益较少的患者暴露于不必要的安全风险中,并尽快开展针对该亚组患者的治疗有效性的研究。
2.基于生物学标志的临床试验设计新思路
美国FDA在2012年发布了《临床试验富集设计指导》意见稿,该意见对富集设计解释为:在随机对照临床试验中,利用患者的特征来确定试验的入组人群,从而使目标药物的有效性在该特定人群中更容易显现。目前有两种基于富集策略的临床试验设计方案。①伞式研究(“umbrella”studies):所招募的同一种疾病患者,按照生物学标志进行分组,比如定义不同的基因突变亚组,每个亚组施予不同的靶向药物,伞式研究的最大优点是将罕见的突变事件集中起来,形成具有特征的临床亚组,观察相应靶向药物的临床疗效。②篮式研究(“basket”studies):招募多种疾病患者,将带有相同靶基因的不同疾病患者作为一个研究亚组,每个亚组用相应靶向药物进行治疗,评价治疗效果。篮式研究的本质就是一种药物治疗多种疾病,对于癌症来讲,根据患者基因突变的不同,实现同癌异治,异癌同治,其依据是同一种部位的癌症可能由不同基因突变及相关机制形成,应该用不同的治疗药物,而相同的基因突变可能导致不同部位的癌症,应该用相同的治疗药物。两种类型研究在肿瘤靶向药物治疗中应用较为成熟。
2017年Lancet Oncology介绍了一项临床疗效评价的研究结果,性质属于伞式研究。间变性淋巴瘤激酶(ALK)是强力致癌驱动基因,Ceritinib是新一代ALK抑制剂,在研究者进行的第一阶段和第二阶段的研究中,Ceritinib已被证明对化疗后进展的ALK抑制剂初治和ALK抑制剂预治疗患者具有高度活性。非小细胞肺癌患者中有一类患者存在ALK重排,本次临床试验中,研究者收集这类患者作为研究对象,研究目的是通过随机对照试验比较Ceritinib(ALK抑制剂)与单药化疗的疗效和安全性。主要终点是无进展生存期。研究实施时间为2013年6月至2015年11月,将231例患者随机分为两组,实验组用Ceritinib,简称Ceritinib组,对照组称为化疗组,用化疗药物培美曲塞或多西紫杉醇。中位随访时间为16.5个月,与化疗组相比,Ceritinib组显示无进展生存期中位数显著改善,Ceritinib组为5.4月(95%CI:4.1~6.9),化疗组为1.6个月(1.4~2.8),危险比0.49(0.36~0.67)。研究结果表明,具有ALK重排生物学标志的非小细胞肺癌患者在既往治疗失败后,从更有效的ALK抑制剂Ceritinib中获得显著的临床益处,并且建立了与该患者群体中的化疗相比更有效的治疗选择。
(三)疾病预后研究
预后研究是对罹患疾病后预期出现某种或某类结局概率大小的研究,如肺癌患者5年及10年生存率,疾病结局或疾病预后不仅是简单的生存、治愈、死亡的概率,还包括治愈与死亡之间的各种结局或状态的出现频率,如缓解、复发、迁延、慢性化、恶化、残疾、合并症、生命质量等,准确估计疾病预后是临床实践的重要内容,既是对疾病自然史和影响因素的深刻认识,又是对各种医疗干预效应的客观把握,在分子流行病学时代,阐明以上各个环节的生物学基础及其相关生物学标志成为预后研究的重要内容,具有十分重要的理论意义和实际意义,具有广阔的临床实践应用前景。从分子流行病学视角审视疾病预后研究的设计,以下几点需要强调:
1.研究设计类型
预后研究包括疾病自然史及相关生物学标志的研究、疾病预后因素及其相关生物学标志的研究、临床干预对疾病预后作用及其分子机制研究等,所应用的研究设计类型涵盖了前述分子流行病学三大类研究方法,包括病例报告、系列病例研究、横断面研究、纵向研究、病例对照研究、队列研究、巢式病例对照研究等新型流行病学研究方法、随机对照试验等实验性研究、预测模型研究等。
2.了解疾病自然史的重要性
对所研究疾病发生发展自然史的生物学基础的了解是疾病预后研究的前提,致病因素作用于机体至临床结局之间的暴露标志、效应标志、易感性标志以及临床及其他因素的干预对疾病自然发展规律的影响是非常复杂的,这些研究越深入,阐明疾病预后的影响因素可能性越大。
3.研究对象的代表性
某种疾病轻重不同、病例来源不同、病例的人口学特征不同等因素都会影响疾病预后,对各种结局出现频率进行估计时要充分考虑。
4.关注疾病不同亚组的临床结局
同临床疗效研究相同,传统的预后评价主要关注某病患者或所有临床类型患者的各种结局的概率,随着分子流行病学及相关学科的发展,精准预测不同亚组的临床结局已经成为精准医学的重要内容,某一疾病异质性决定了其发病机制有所不同,那么与此密切相关的临床疗效及各亚型的预后必然不同。
5.疾病预后相关生物学标志的甄别
预后生物学标志的筛选是一个非常复杂的系统工程,要重视控制各种偏倚对研究结果的影响,在探讨各种影响因素对疾病预后作用时保持清醒的因果关联研究思路,既要阐明影响预后的生物学标志,又要明确生物学标志所表达的一系列影响预后的生物学机制的科学性,还要注意宏观和微观的联系。
近年,预后研究取得了相当大的进展,不断向精准估计各系统疾病临床预后迈进。Stefan团队进行了一项多中心回顾性研究,了解热休克蛋白70与肿瘤浸润的NK细胞是否可以作为头颈部鳞状细胞癌放化疗后病人的预后指标。所关注的生物学标志是热休克蛋白70(HSP70)和肿瘤浸润的NK细胞。研究对象选自2004—2012年经病理验证的145例头颈部恶性肿瘤患者,所有患者均接受根治性手术及术后化疗。结果显示,HSP70的表达与肿瘤浸润的CD56 +NK细胞有关,可以作为生存和疾病复发的潜在指标。HSP70高表达的肿瘤患者与HSP70低表达组比较,显示总生存率、局部无进展生存率和无远处转移生存率显著下降,调整相关变量后仍呈现显著性差异。肿瘤浸润性CD56 +NK细胞数量少或缺失与总生存率、局部无进展生存率和无远处转移生存率显著下降有关。
有学者对胶质瘤的预后和分子学特征与Rab27a表达的关系进行了研究。用220例胶质瘤患者通过CGGA数据集获得的全基因组mRNA表达微阵列数据集作为发现集,用Kaplan-Meier法进行生存分析。纳入三个额外的数据集作为验证集。用GO分析和基因集变异分析对Ⅳ级胶质瘤Rab27a进行功能注释。研究表明,Rab27a表达与所有级别胶质瘤的不良预后明显相关,提示Rab27a作为一种新型的生物标志物,具有潜在的临床意义。
另一篇2017年发表于新英格兰医学杂志(NEJM)的论文,展示了以非小细胞肺癌研究对象作为疾病队列的研究,其目的是用前瞻性研究的方法观察非小细胞肺癌(non-smallcell lung cancer, NSCLC)的肿瘤异质性变化与临床结局之间的关联,从而确定早期非小细胞癌的演变进程,为非小细胞癌的发展预测提供依据。这项前瞻性队列研究收集了100例在系统治疗前就进行了肿瘤切除的早期非小细胞肺癌患者的肿瘤,并对其进行全基因组测序,经过测序后对327个肿瘤区域分析所有克隆和亚克隆的情况,判断其演变情况,并追踪调查患者肿瘤切除术后的生存情况(死亡或复发时间),从而进一步分析肿瘤异质性与术后生存之间的关系。结果发现, EGFRMETBRAFTP53这些基因发生驱动突变是可以稳定持续克隆的。而有超过75%的肿瘤是在后续演变过程中发生异质性驱动改变,多发生在 PIK3CA基因、 NF1基因以及参与染色体修饰、DNA损伤应答基因和修补的基因。基因复制和持续动态的染色体变异是与肿瘤异质性相关的,并且会导致平行驱动体细胞克隆的变化,其效应会放大到 CDK4FOXA1BCL11A基因。多变量线性回归分析结果发现,增加拷贝数后肿瘤异质性发现是患者肿瘤复发或死亡的危险因素(HR=4.9, P=4.4×10 -4)。结果表明,肿瘤异质性通过介导染色体的不稳定性增加患者肿瘤复发或死亡的风险,提示染色体不稳定性可以作为肿瘤切除术后的预后检测指标。
随着精准医学和大数据时代的到来,系统生物学、系统流行病学、生物信息学的不断发展,暴露组学、基因组学等多组学研究的不断深入,先进的生物学技术、生物信息学技术和统计学方法的不断涌现和完善,特别是国内外对自然人群队列、疾病队列等不同类型的队列及生物标本库建立的重视,分子流行病学研究将面临新的机遇和挑战,其研究设计的质量也受到新的考验,因此,更要把握分子流行病学研究设计的核心,要有反复凝练的具有创新性、科学性、实用性、可行性的科学问题或研究目标,以及以生物学标志为核心,以疾病与健康为落脚点的分子流行病学研究,遵循流行病学研究设计原则,严格质量控制,绘制高水平的研究设计蓝图,产出高质量的研究成果,为精准疾病预防与控制和人群健康促进作出更大的贡献。
(王素萍 党小荣 易彬堂编,刘殿武审)