信息中心

Nature:构建出一种计算机模型,可以准确预测新冠肺炎在美国10个大型城市的传播情况
来源:     时间 : 2020-11-16

在一项新的研究中,来自美国斯坦福大学和西北大学的研究人员构建出一种计算机模型,并利用这种模型通过分析驱动感染风险的三个因素---人们在一天中去了哪里,停留了多长时间,以及有多少其他人在同一时间访问同一地点---准确预测了今年春天COVID-19在美国10个主要城市的传播情况。相关研究结果于2020年11月10日在线发表在Nature期刊上,论文标题为“Mobility network models of COVID-19 explain inequities and inform reopening”。

图片来自Nature, 2020, doi:10.1038/s41586-020-2923-3。


论文通讯作者、斯坦福大学计算机科学家Jure Leskovec说,“我们构建了一种计算机模型,来分析不同人口背景、不同社区的人是如何访问不同类型的地方,这些地方或多或少都是拥挤的。基于所有这些因素,我们可以预测在任何给定地点或时间发生新感染的可能性。”

这项研究合并了人口统计学数据、流行病学估计和匿名手机位置信息,似乎证实了大多数COVID-19传播发生在“超级传染源(superspreader)”场所,比如全方位服务的餐馆、健身中心和咖啡馆,在那里,人们长时间地呆在狭小的空间里。这些研究人员说,他们的模型可以作为官员们的工具,通过揭示新感染和销售损失之间的权衡,帮助他们在重新开始营业(比如在20%或50%的营业能力下)时尽量减少COVID-19的传播。

论文共同作者、坦福大学人文与科学学院社会学教授David Grusky说,这种预测能力特别有价值,这是因为它针对少数族裔和低收入人群不成比例的感染率背后的因素提供了有用的新见解。他说,“在过去,这些差异被认为是由已存在的医疗状况和不平等的医疗服务驱动的,而我们的模型表明,人群流动模式也有助于推动这些不成比例的风险。”

Grusky说,该模型显示了重新开放占用上限(occupancy caps)较低的企业往往最有利于弱势群体。Grusky 说,“这是因为雇佣少数族裔和低收入人群的地方往往规模较小,而且更加拥挤,对重新开业的商店设置入住上限可以降低他们面临的风险。我们有责任建立重新开业计划,从而消除--或至少减少--当前做法所造成的不平等。”

Leskovec说,这种模型“提供了迄今为止最有力的证据”,表明今年春天颁布的待在家里的政策减少了外出旅行的次数,并减缓了新感染的速度。

追随脚步

这项研究追踪了全美10个最大的大都会区9800万美国人在50万个不同场所(从餐馆、健身中心到宠物店和新车经销商)的活动。

这些研究人员包括斯坦福大学博士生Serina Chang、Pang Wei Koh和Emma Pierson(今年夏天毕业),以及西北大学的研究员Jaline Gerardin和Beth Redbird,他们为这10个大都会区收集研究数据。按照人口顺序,这些城市包括纽约、洛杉矶、芝加哥、达拉斯、华盛顿特区、休斯顿、亚特兰大、迈阿密、费城和旧金山。

作为一家从移动应用中汇集匿名位置数据的公司,SafeGraph给这些研究人员提供的数据显示,在553000个公共场所中,人们每天去了哪些地方,如五金店和宗教场所;去了多长时间;关键的是,每个场所的面积是多少,这样这些研究人员就可以确定每小时的占用密度(occupancy density)。

这些研究人员分两个不同的阶段对3月8日至5月9日的数据进行了分析。在第一阶段,他们向他们的模型输入流动性数据,并设计他们的模型系统来计算一个关键的流行病学变量:这种病毒在这10个大都市地区各种不同情况下的传播率。在现实生活中,人们不可能提前知道感染者和易感者何时何地接触,从而产生潜在的新感染。但在这种模型中,他们开发并完善了一系列方程来计算不同地点和时间发生感染事件的概率。这些方程之所以能够解决未知变量,是因为他们向计算机输入了一个重要的已知事实:每个城市每天有多少COVID-19感染病例被报告给卫生官员。

这些研究人员完善了这种模型,直到它能够确定这种病毒在每个城市的传播率。传播率因城市而异,这取决于各种因素:从人们出家门的频率到他们去了哪些类型的场所。

一旦这些研究人员获得了这10个大都市的传播率,他们就在第二阶段测试了这种模型,要求它将每个城市的传播率与它们的流动模式数据相乘,以预测新的COVID-19感染情况。所获得的预测结果与卫生官员的实际报告结果密切相关,这使得这些研究人员对这种模型的可靠性充满信心。

预测感染

通过将这种模型与57000个人口普查街区组(600至3000人的街区)数据库中的人口数据相结合,这些研究人员展示了少数族裔和低收入人群如何因为工作需要而更频繁地离开家,并在较小的、更拥挤的场所购物,而不是像收入较高的人那样,他们可以在家工作,使用送货上门来避免购物,并在外出时光顾更宽敞的营业场所。比如,这项研究显示,与白人相比,非白人人群购买杂货被感染的风险大约是白人的两倍。Chang说,“通过合并流动性、人口统计学和流行病学数据集,我们能够利用我们的模型来分析不同重新开放营业政策的有效性和公平性。”

这些研究人员已经公开了他们所使用的工具和数据,以便人们可以重现这些发现并在这些发现的基础上进行新的研究。

Leskovec说,“原则上,任何人都可以使用这种模型来了解不同待在家里和企业关闭政策决定的后果。”他的团队如今正在努力将这种模型开发成一种方便用户的工具,供政策制定者和公共卫生官员使用。