信息中心

Nat Med:新冠疫情下城市危机预测出炉!城市密度越大,疫情可能越久
来源:     时间 : 2020-10-15

预测COVID-19的流行病学是指导全球疫情应对的一项重点工作。究竟是哪些因素推动了COVID-19在城市的传播,这仍然是一个不清楚的,初步分析出气候在决定疫情增长方面的作用是有限的。

传染病传播的空间异质性可能受到当地人口或人员流动差异的影响,因此,由于易感个体的较高接触率,较高的人口密度可能促进病原体的传播。对于呼吸道病原体来说,流行病中的病例时间聚类(即观察到大多数病的最短时间), 会随着室内拥挤程度的增加、社会经济因素和气候因素发生变化。

对流感观察,当发病率在时间上均匀分布时,病例的时间集中度最小;当发病率在特定天数内变得更为集中时,病例的时间集中度会增加。在任何给定的地点,较高的病例时间集中度可能要求公共卫生系统有更大的快速应对能力,特别是对于新出现的呼吸道病原体,比如SARS-CoV-2。

中国和意大利详细提供了广泛地理背景下的COVID-19流行病学时间序列(time series)数据。因此,这两个国家的疫情提供了一个机会来评估当地因素在影响流行病行为方面的作用。

基于此,在一项新的研究中,来自英国牛津大学、美国东北大学、哈佛大学和波士顿儿童医院等研究机构的研究人员使用来自中国各个地级市和意大利各省的日常流行病学数据、气候和人口数据以及利用百度和COVID-19聚合流动研究数据集(COVID-19 Aggregated Mobility Research Dataset)(https://www.google.com/covid19/mobility/)的人类流动数据衡量的对当地干预措施的反应来确定传播的驱动因素,重点关注病例的时间聚类在中国各个地级市和意大利各省之间如何不同。

相关研究结果于2020年10月5日在线发表在Nature Medicine期刊上,论文标题为“Crowding and the shape of COVID-19 epidemics”。

这些作者使用了中国各个地级市(n = 293)和意大利各个省(n = 108)汇总的COVID-19确诊病例的每日发病率数据(图1a)。中国的地级市和意大利的省是通常有一个城市中心的行政单位(图1b)。他们汇总了从政府官方报告中收集到的个人层面的日常数据。

中国每个地级市的流行病学数据被截断,以排除第一次流行期间报告病例的第一天之前和最后一天之后的日期。2020年3月1日以后报告的从国外输入到中国的病例被排除在分析范围之外。由于湖北省缺乏地级市流行病学数据,且在2020年1月20日之前的病例报告存在一致性问题,故剔除了湖北省的所有流行病学数据。中国各地级市的疫情曲线形状不一,有的地级市报告病例快速上升和下降,有的地级市疫情持续时间较长(图1a)。

图1.中国地级市的人口密集分布图,图片来自Nature Medicine, 2020, doi:10.1038/s41591-020-1104-0。


为了描述中国各个地级市和意大利各省病例的时间聚类特征,这些作者计算了新发病例分布的香农多样性指数(Shannon diversity index)。当所有病例发生在同一天时,香农多样性指数******;当疫情期间每天的新发病例数相同时,香农多样性指数最小。中国每个地级市报告的COVID-19病例的总发病率与中国的香农多样性指数呈强烈的负相关(图1c)。

因此,峰值较低的疫情具有较大的总发病率(皮尔逊相关系数r = -0.67,95%置信区间(CI),-0.73~-0.59,P<0.01;对于意大利,R2 = 0.33,P<0.01)。他们推测,病例的总发病率和时间聚类在不同城市之间的差异是人口空间结构的结果。

为了检验这一假设,这些作者使用了劳埃德平均拥挤度指数(Lloyd’s index of mean crowding),将每个空间网格单元的人口数视为一个独立的单元来处理(图1)。这里使用的术语“平均拥挤度”是一个特定的地理指标,它既概括了人口密度,也概括了人口密度在一个地级市内的分布情况(图1)。劳埃德平均拥挤度指数的数值越高,说明人口结构在空间上是聚集的。他们还进行了对数线性回归建模,以确定病例的时间聚类与社会经济变量和环境变量之间的关联性,包括疫情爆发期间的人口流动减少。

这些作者发现病例的时间聚类与平均接触人数显著负相关(P <0.01),但与平均人口密度正相关(P <0.01),并且在中国和意大利之间差异很大(图2)。这一观察结果与预测易感个体的可获得性增加使得在拥挤的地区出现较高的疫情峰值的经典流行病学模型形成鲜明对比。最能解释这种关系的空间尺度是10×10公里,不过这一结果在1和50平方公里之间的所有空间尺度都有统计学意义(P <0.01)。

图2. 拥挤和中国COVID-19传播的时间聚类,图片来自Nature Medicine, 2020, doi:10.1038/s41591-020-1104-0。



利用每周的人口流动性数据,这些作者发现疫情期间城市内的人口流动性与病例的时间聚类相关---即流动性减少较大的地级市也有较低的疫情峰值(P<0.01)。当将流动性减少与拥挤度和湿度结合在一种模型中时,他们发现这些变量各自仍然是病例时间聚类的显著预测因素(P <0.01)。这些结果表明,虽然减少流动性的措施可以成功地让疫情曲线趋于平坦,但人口拥挤是造成这两个国家流行病曲线形状形成的一个独立因素。

针对为何更拥挤的城市经历较少的曲线上有峰值的疫情,这些作者推测拥挤使得这种疾病在家庭成员之间和城市人口之间持续传播,从而导致发病率在整个疫情期间广泛分布。

为此,他们模拟了两类人群的随机流行病动力学。在简单的、混合良好的传播模型中,拥挤地区的接触率很高,这与他们的研究结果并不一致,这是因为该模型预测拥挤地区会有更多时间上的聚集性疫情爆发。

为了反映现实的接触模式,他们创建了分层结构的人群,在这些人群中,个体在他们的社会单元(含义广泛,比如表家庭、养老院、医院和监狱等)内具有高接触率;与来自其他社会单元但在同一社区内的个人接触率较低;与同一地级市内其他社区的人接触相当稀少(图3a)。

图3. 在拥挤的人口中产生曲线上的峰较少的疫情,来自Nature Medicine, 2020, doi:10.1038/s41591-020-1104-0。


这些假设与实施封锁后的大多数传播发生在家庭或其他密切接触的情况下的报告相一致。在这种情形下,人口不那么密集的地级市往往有曲线上存在更多峰的持续时间更短的被隔离在特定社区的疫情,而人口比较密集的地级市可以维持更长时间的,最终规模更大的,并在联系更紧密的社区之间蔓延的疫情(图3b,c)。此外,如果COVID-19的再生数过度分散,那么由于接触者的存在,拥挤可能使得当地疫情得以更广泛地传播。

这些作者还模拟了广泛的社会隔离措施下的疫情爆发动态,如在中国各个地级市观察到的(接触率下降75%)。如果社会隔离使得所有地点的非家庭接触减少了相同的相对数量,那么在拥挤的地区将有更多的接触,这是因为基线接触率较高。因此,在干预后,拥挤地区爆发的疫情在规模上可能会更大,需要更长的时间才能结束(图3d和图1c)。

利用来自中国的拟合模型,再结合全球综合协变量(globally comprehensive covariate),这些作者将他们的研究结果外推到全球的310个城市(图4),百度没有提供中国以外城市的人类流动数据。因此,他们使用谷歌公司的COVID流动研究数据集中的聚合人类流动数据来捕捉人类流动在不同时期的相对差异。

在全球范围内,以黄色表示的城市被预测为疫情较为集中且达到高峰,而以蓝色表示的城市被预测为疫情持续时间较长(图4b)。一般来说,沿海城市的疫情峰值较低,规模较大,持续时间较长,这可能是由于沿海城市人口高度拥挤造成的。

图4. 预测了全球的疫情峰值,来自Nature Medicine, 2020, doi:10.1038/s41591-020-1104-0。


他们的模型预测,在相对不拥挤的城市,COVID-19病例的峰值会相对短暂、强烈,这是因为这些城市的居民都住在自己的社区,而不是自由地混杂在一起。然而,相比于农村,在拥挤的城市的人们更有可能不得不应对持续时间较长的疫情。比如,他们预测那些人口分布相对均匀的城市,如蒙古的乌兰巴托,可能会出现短期的病例激增。

但是,在人口密度更高的城市中心,比如西班牙的马德里,可能会出现更持久的疫情。这些预测依赖于中国和意大利城市的第一次流行病曲线的拟合关系,因此,在推广到其他环境时应非常谨慎地加以解释。