致死率、R0和群体免疫

無定著 2020-03-15 05:23:08

排版更好的一版 2020年3月24日发在大象公会公众号上，可以自行搜索《概念陷阱：病死率、R0和群体免疫》

一个搞数据的人，如果不问数据来源、数据质量、数据产生过程（data generating process），拿到数据，就直接跑模型，那TA一定不是一个好的数据科学家。与此同时，跑模型还要意识到模型的假设是什么，和现实可能差的多远，包含了哪些参数，没有考虑到的参数有哪些等等等等。总的来说，就是George Box的那句名言——和现实的复杂程度相比，“所有模型都是错的，但是有些模型是有用的。”

Essentially, all models are wrong, but some are useful

COVID-19全球大流行，新闻报道、各种公众号和评论都开始频繁提到各种流行病学名词，引用这样那样的数据，这篇文章主要写写估算致死率、R0和群体免疫三个测量数值的难度和误差。

致死率

首先来看致死率（Case fatality rate），我觉得更合适的叫法应该是case fatality ratio。这个测量工具是非常直观和容易理解的，就是在一定时期里，在确诊某种疾病的病人中，因此病而死的比例。然而问题是这个定义并不直接涉及这个“一定时期”是多久，模糊就模糊在这里。理想情况下，某种疾病发病痊愈时间都较快，我们在短期内就可以判断所有确诊病人的痊愈和死亡情况。然而流行病的发生是一个不间断的过程，有新病例的出现，有病程较长最后痊愈或者最后死亡的人，在这个过程中如何估算致死率就是一个问题。

再从分子和分母的角度看——分母是所有确诊的病人，在现在检测条件有限的情况下，这个数字一定是小于目前已感染的人群的，重症病人的比例较高（这里暂时不考虑检测的假阴和假阳情况）。同时，像华州养老院感染这样的情况，分母人群大多高龄有基础疾病。从这些角度看，致死率可能会高估了更广泛人群中的致死率。与此同时，分子是已经确认死亡的人，由于某些人的病程较长，一些将死未死的人，还没有被计入分子中，而如果数据发布方没有固定分母，不断加入新确诊人群进入分母，那么这个数字浮动也是有可能低估致死率。致死率，在医院和医院之间，根据不同的接收病人情况、治疗方法、医疗水平、资源多寡等，都会有很大的差别。

另外，致死率和我们平常用的死亡率完全不是同一个概念。死亡率（death rate）的分母单位是（person-years）就是一个固定区域内的所有人乘以时间（大部分以年作为时间单位），因为所有人都是有死亡风险的，分子是在这个风险人群和风险时间段内死亡的人数。

R0 (基本传染数 - Basic reproduction number)

再来看R0，首先发音应该是R-naught，是病原体传染性（contagiousness）强弱的一个指标, 估算的是在传染病爆发初期（所有人都没有免疫的时候）一个被感染者平均可以直接传染多少人。例如下图的R0 大概就在2左右。我们为什么关心R0呢？因为当R0大于1的时候，传染病会变得流行，迅速传播开，如果不防控，就会指数增长；R0等于1的时候，传染病是地方性的（endemic), 可控的，与人群长期存在；而只有R0小于1的时候，传染病才会因为无法传播开而逐渐消失。

上图R0大约为2

然而R0目前的应用模糊就模糊在它同时包含了对人类行为和病原体生物学特性的估计。对于任何一种传染病的病原体，你如果做一下文献综述，会发觉R0的估算可能会有很大的差别。估算R0最常见的方法是估算以下三个主要参数——一个被感染者和易感者（即未感染者）每次接触传染病原体的概率b(infection rate)，一个被感染者感染之后有传染性的传播时长D (contact duration)，一个感染者和易感者接触的频率k(contact rate)。你当然还可以根据病原体、宿主和环境的特性引入其它参数，增加模型的复杂性。

R0越大，抗疫难度就越大，R0也会随着抗疫政策、人群隔离行为等等环境因素，在传染病流行的进程中发生变化。最容易影响的参数就是人与人接触频率, 会根据人口密度，社会组织类型、政策等因素变化。R0基本上都是从模型中估算出来的，而每一个参数的估算都需要一定的假设。从已有经验看，COVID-19传染性较强，且可以无症状传染，这就增加了参数b和D，因此人们需要通过隔离，减少亲密接触来尽可能降低R0。中国封城之后两周的高强度抗疫可以说已经把R0降到了1以下。但是一旦复工，如果有无症状的新增病例出现，加上其它地区的输入病例，由于大城市人口密度很高，R0又会上升。人类把这个病毒闷死的努力在中国已经做了，但是失败了，但这并不意味着减缓病毒扩散的努力都是徒劳的，在中国早期抗疫中得到的很多经验也是不少人用生命代价换来的。

COVID-19本身的特性不是以人的意志为转移的——无症状传染，在某些个体中很长的潜伏期，这是这次疫情“天灾”的一面。R0短期内降到1以下在某些社会是可以做到的，问题是需要维持很长一段时间使得所有潜伏期病例都被发现隔离，还有一些轻症未必就医等问题。只要有遗漏，一旦这些高强度抗疫举措取消，病毒又会传播开来。而抗疫期间，付出的极大社会成本，又由哪些人来承担呢？感染病毒有一定的致死率，然而经济停摆、强制隔离，也是会死人的。社会上最脆弱的人群，失业，没有储蓄，甚至无家可归，不少人有其他的慢性疾病，还有很多人为了维持大部分人的基本生活需求（水电油气垃圾处理物流交通等等），根本不可能在家上班。受疫情影响严重的微小型企业（旅游、餐饮等），很可能因为现金流断裂而破产。各个国家目前的各种政策和措施，比如停课、取消各种集会等等，都是在努力降低R0，减缓病毒的扩散速度，减轻医疗系统的压力。而减缓的这个过程（在更长的时间更少的人死去）就是降低死亡率，延长更多人的生命。极端的抗疫措施的背后，有哪些看不见的人在为此付出代价？疫情当下，没有一个决策是容易的，在资源有限的前提下，天平的一头是人命，另一头也是人命。

群体免疫（Herd immunity）

群体免疫是和R0联系非常紧密的一个概念。为什么大规模注射疫苗对于大部分传染病是最有效的方式？因为易感人群比例大幅下降了，而免疫人群又切断了部分到易感者的传播链，有一部分易感者就被保护起来了。我们用R*来表示有免疫之后人群中平均一个被感染者的平均传染人数，这个人数大致是R0乘以（1-H)。H是人群中的免疫人群数量比例。我们由此可以来推断，要彻底告别该传染病流行 (即R* 小于1)，需要多少人群具有免疫。临界值H = 1- 1/R0。假设R0是2，那么我们至少需要50%的人群具有群体免疫。

红色：有传染性的已感染者黄色：易感者绿色：有免疫者

群体免疫的计算，完全依赖对于R0的估算。以上已经提到R0估算的各种问题，因为模型不同，算出的R0差别会很大，例如麻疹的传染性极强，通常R0的估算范围在12-18左右，但17年一篇系统性文献回顾发现，麻疹的R0范围在不同地区差别极大3.7–203.3。因此估算群体免疫，对于不同国家和地区，根据R0的估值不同，也会差别很大。

在目前COVID-19是全新的病毒、没有疫苗的情况下，大部分人都是易感人群。估算群体免疫还要考虑，痊愈人群的免疫持续时间有多久？对于不同病株（病毒变异）的有效性如何？目前的经验还无法对这些问题下定论。在疫苗出来之前，COVID-19流行结束靠群体免疫，实在是闷死病毒无望至今的无奈之举。

群体免疫广泛引用的论文是这篇。这里不得不提，对于大部分传染病，都需要大部分人注射疫苗才能形成群体免疫，因此及时注射疫苗既是保护自己和家人，也是保护其他人。千万不要依赖群体免疫，抱有侥幸，如果大家都这么想，群体免疫就没了。之前很多人（美国、英国、爱尔兰等）因为宗教或者其它原因（相信了Andrew Wakefield关于MMR疫苗和自闭症的问题研究【后被撤稿】），拒绝给小孩注射MMR疫苗，麻疹很快就复发了。这次全球大流行，对于很多传染病学家，恐怕是意料之中的。人类和传染病斗智斗勇这么多年，最有效的终极大招，还是疫苗。

Fine, Paul EM. "Herd immunity: history, theory, practice." Epidemiologic reviews 15.2 (1993): 265-302.

流行病医疗科普

回应转发赞收藏

無定著 (Seattle, United States)

什么都不懂（花名咣、咣咣、咣咣咣） -你已经念了六个咣，包括这个， ...

致死率、R0和群体免疫

致死率

R0 (基本传染数 - Basic reproduction number)

群体免疫（Herd immunity）

無定著的最新日记 · · · · · · ( 全部 )

热门话题 · · · · · · ( 去话题广场 )