(二)利用人工智能和多源数据进行传染病预测和慢性病危险因素筛查

应用单位:重庆市卫生健康统计信息中心、重庆市疾病预防控制中心
涉及科室:呼吸内科、传染科
疾病种类:流感、手足口病、慢性阻塞性肺疾病
案例简介:本申报案例应用于城市高发传染病提前防控及慢性病及时预防,涉及的主要病种为流感、手足口病、慢性阻塞性肺疾病,涉及的医疗科室为呼吸内科、传染科。本案例打造的疾病预测防控体系,利用“互联网+医疗健康”大数据前沿技术,提出“宏观+微观”的深度智能疾病预测方法。预测模型的基本原理可以分为三个部分:一是筛选、收集流感疫情相关的宏观和微观数据。二是开发人工智能融合模型,该模型不仅融合了传染病预测的经典方法——时间序列模型,而且融合了多种人工智能方法,如随机森林模型和循环神经网络模型。三是运用模型得到传染病相关指标。流感预测模型自2018年起上线应用,与传统流感监测模型相比,该模型可以提前一周预测流感指标,准确率达90%以上,成为国内首个上线的实测传染病预测模型。本案例在实施前积累了超过2 000万份城市级健康档案数据以及2012年至今的天气、百度指数、哨点医院监测的ILI%(流感样病例百分比)、流感病历以及微博舆情等数据;案例实施后持续积累天气、百度指数、哨点医院监测的ILI%、流感病历等数据。同时,本案例根据疾病防控的实际业务需求研发传染病预测系统,支撑传染病预测的落地应用,可指导民众进行疾病预防,对重庆市卫生健康相关部门和公众起到预警的作用,助力政府部门在相关的疾病防控工作中提升效率,从而降低疾病预防和控制成本。
1.案例背景
目前机构实际采用的传染病疫情预防预警系统,包括流感预防预警系统,主要依赖传统监测手段。本案例通过与各级医疗机构、疾病预防控制中心和传染病监测哨点医院协作,由医疗机构诊断并报告临床诊断病例和确诊病例,研究人员基于该系统报告的信息及自行获取的气象等数据,建立疾病预测模型。这种“定时抽样,每周汇总”的数据获取方式,存在数据结果相对滞后、人力物力耗费量大、监测与上报过程烦琐、数据来源单一、无其他来源数据比对修正的问题。
在慢性病预防上,目前对于重大慢性疾病的控制工作仍主要集中在发病后的长期随访、干预,较缺少事先的预防机制。在筛查中,由于面向的人群有一定局限性,可能存在很大一部分患者不知晓患病的情况,因而缺乏及时有效的防控措施。随着我国人口老龄化进程加快,诸如恶性肿瘤、糖尿病等慢性病多发,加大了政府卫生费用支出和医疗财政负担。
因此,精准、高效的疾病预测防控体系可显著提高政府疾病控制水平,大幅减少医疗财政负担(图3-3)。
图3-3 案例背景
2.案例亮点
本案例利用“互联网+医疗健康”大数据前沿技术,提出“宏观+微观”的疾病预测方法,基于全面的影响因子收集、多种维度的模型建立,将一系列互联网机器学习算法应用于疾病预测。不仅应用宏观层面的数据学习历史经验,还从微观层面精确评估个体风险,再汇总到宏观层面,使疾病预测能够达到时效性更强、精度更高、范围更广、输出更稳定、可扩展性更强的要求(图3-4)。
图3-4 案例亮点
通过整合全国上百个城市的环境气象因子(环境、天气、季节),人口信息(人口、流动、结构),产业结构,经济教育发展,地区生活行为,医疗习惯,就诊行为等一系列宏观因子,尝试对历史数据进行挖掘,进行时间序列分析。
在个人层面,通过整合全方位、多维度的预测因子和信息来预测疾病发生风险。这些信息包括信息高度相关,但频度较低、分布较稀疏的医疗健康因子(体检、就诊、告知等),也包括信息间接相关,但信息频度和深度较高的个人行为因子(财务、职业、生活等)和互联网数据因子(舆情、行为、LBS等)等。通过精准评估个人层面风险并汇总到宏观层面,能够深入挖掘宏观层面无法统计的细颗粒度的信息,从而提升预测精度。
本案例的算法融合了多种人工智能方法,如时间序列模型、循环神经网络、梯度提升决策树、随机森林等,提高了预测准确度。
除模型研发外,本案例基于疾病防控的实际业务需求研发了传染病预测系统。自2018年3月在重庆地区上线使用,该系统实现了对下周流感ILI%的预测。疾病预测系统的问题修复及反馈机制包含两部分:数据质量自查与人工反馈。在使用多维度海量数据进行预测时,考虑到可能出现的数据质量参差不齐的情况,医院引入了数据异常检测模型。通过对导入的数据进行自动检测、异常数据点自动识别与标注,再交由疾控专家进行判定。其检测结果能够持续优化模型,保证海量数据的质量和真实性。疾控工作人员上传哨点医院数据后,系统可调用异常检测模型对数据进行异常判断(如数据维持在定值,异常高/低等)。
此外,疾病预测系统中还有用户反馈收集入口,预测完成后,疾控中心专家可将专家经验或解读上传至系统,专家意见将反馈至模型进行学习和迭代。通过不断收集反馈、融合疾控专家经验,模型也在不断进行优化。
3.应用成效
本项目为业内先进的“AI+”大数据流感/手足口病预测模型及慢阻肺危险因素筛查模型,流感/手足口病模型准确率达90%以上;慢阻肺筛查模型准确率达92%。同时本项目根据疾病防控业务需求,完成疾病预测系统(PC端+移动端)开发并顺利上线,支撑疾病预测项目落地应用。项目病预测论文《自适应AI模型与多源数据在重庆流感预测中的应用》( Forecasting Influenza Activity Using Self- Adaptive AI Model and Multi- Source Data in ChongqingChina) 2019 年 9 月刊登在顶级医学杂志《柳叶刀》( The Lancet)子刊 EBioMedicine上。
4.专家点评
重庆市疾病预测项目专家指出:“在数据层面,本次模型的建立应用了城市级数据,使用超过2 000万份健康档案及电子病历数据,在国际范围内尚属首次;在方法层面,整合上万维度数据因子进行建模,应用先进的人工智能和大数据技术,同时结合本地疾病防控实际业务经验和专家知识,更贴近重庆现状,精确度也显著高于传统方法。专家一致认为,本次疾病预测项目目前取得的研究成果在全国乃至国际范围内都具有实用性和开创性,可助力更多城市在相关疾病的防控工作中提升效率,降低预防和控制成本。”