- +1
防控力度多大才能遏制疫情發(fā)展? 網(wǎng)絡(luò)動(dòng)力學(xué)推演給你答案
原創(chuàng) 張江 集智俱樂部

近期新型冠狀病毒(2019-nCov)引發(fā)的疫情備受關(guān)注,已經(jīng)有一些針對(duì)病毒起源、機(jī)理、傳播的研究。春運(yùn)返崗大潮將至,多地區(qū)紛紛限制公共交通,背后的原因是什么?本文特別關(guān)注由于人群遷徙引起的病毒傳播和疫情擴(kuò)散,根據(jù)經(jīng)典論文提出的方法,采用截至 1 月 28 日的最新人流數(shù)據(jù),預(yù)測(cè)人群遷徙背景下,疫情在多個(gè)城市二次爆發(fā)的風(fēng)險(xiǎn),并嘗試為多個(gè)地區(qū)的交通管制提供理論支持。
聲明:本文在無人為干預(yù)的假設(shè)下,依據(jù)《The Hidden Geometry of Complex, Network-Driven Contagion Phenomena》一文提供的方法,針對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行了初步分析,僅作為科學(xué)探討,不構(gòu)成決策依據(jù)。在現(xiàn)有的強(qiáng)力交通管制下,疫情擴(kuò)散速度應(yīng)遠(yuǎn)小于本文預(yù)測(cè)的數(shù)據(jù)。
新型冠狀病毒(2019-nCov)的爆發(fā)牽動(dòng)著全國(guó)14億人民,甚至是全球70億人的心。病毒傳播的速度非常之快,我們有必要通過大數(shù)據(jù)分析,建模模擬等手段對(duì)數(shù)據(jù)進(jìn)行分析。
目前,無論是正式學(xué)術(shù)刊物發(fā)表的文章還是網(wǎng)絡(luò)上傳播的文章來看,大多集中在對(duì)于新型冠狀病毒的來源,以及傳播特性的估算。特別是,基本再生數(shù)作為一個(gè)能夠反映病毒傳播速度的參數(shù)引起了廣泛的爭(zhēng)論。然而,目前的這些討論大多集中在對(duì)武漢疫情的分析,而較少關(guān)注疫情隨著人類的遷徙行為而引發(fā)的全國(guó)乃至全球城市的傳播。也有一些文章通過各種渠道的人類遷徙數(shù)據(jù)來分析病毒的傳播,但這些分析大多是對(duì)從武漢遷出的各種渠道的流量進(jìn)行計(jì)算,尚沒有討論這些遷徙行為對(duì)病毒在其它城市的爆發(fā)進(jìn)行廣泛的討論。進(jìn)一步,目前我們尚未看到對(duì)這種二級(jí)爆發(fā)現(xiàn)象的定量分析文章。
本文將試圖對(duì)由于大量的人口流動(dòng)而導(dǎo)致的病毒二級(jí)甚至三級(jí)爆發(fā)的可能性進(jìn)行了探討。而且,我們采用的是定量化計(jì)算機(jī)模擬與數(shù)據(jù)擬合并進(jìn)的手段來完成的多城市間病毒傳播與擴(kuò)散行為的分析。我們采納了2013年Dirk Brockmann與 Dirk Helbing二人合著的經(jīng)典文章《The Hidden Geometry of Complex, Network-Driven Contagion Phenomena》一文(后面簡(jiǎn)稱《幾何》)中所述及的方法,并結(jié)合利用百度遷徙公布的每個(gè)城市到各個(gè)目標(biāo)城市的流出比例數(shù)據(jù),以及澎湃新聞美數(shù)課整理提供數(shù)據(jù),以及2016年的百度遷徙數(shù)據(jù)等多數(shù)據(jù)來源選定參數(shù)進(jìn)行建模分析的。
一、有效距離
在《幾何》一文中,作者們提出了一種全新的距離概念,被稱為有效距離,并聲稱在病毒擴(kuò)散傳播中,該距離遠(yuǎn)比地理距離起到了更加至關(guān)重要的作用。那么,這種有效距離是什么呢?其實(shí)就是現(xiàn)代人類乘坐交通工具進(jìn)行的長(zhǎng)程遷徙而形成的一種幾何效應(yīng)。
具體來講,我們不妨假設(shè)人們是一個(gè)毫無目的的隨機(jī)游走粒子,則它們的一些可能從A出發(fā)沿著交通路網(wǎng)中的所有可能路徑到達(dá)B地,在這些粒子中,最先到達(dá)B的粒子所跳轉(zhuǎn)的步數(shù)就是有效距離。這種情況下,即使A和B沒有道路,粒子也可能通過其它城市中轉(zhuǎn)到B。另外,就是當(dāng)粒子從A出發(fā)有多個(gè)城市可以到達(dá)的時(shí)候,它會(huì)按照交通流量大小而隨機(jī)選擇下一步的城市??傊行窂娇梢愿玫乜坍嬋藗兂俗煌üぞ叩某鲂行袨椤?/p>
我們將最新2020年的從百度遷徙上獲得的流量比例數(shù)據(jù)混合2016年的流量數(shù)據(jù)得到任意兩城之間的跳轉(zhuǎn)概率,并根據(jù)這個(gè)概率計(jì)算得到任意兩城市之間的有效距離。我們可以看看,從武漢出發(fā)到達(dá)的所有城市,按照有效距離從小到大的順序排序得到:

那么,根據(jù)《幾何》中的結(jié)論,這個(gè)排名基本就是病毒傳播在時(shí)間上的先后順序了。然而,在大家關(guān)注武漢疫情的早期,無論是媒體還是公眾都忽略了諸如孝感、黃岡、荊州等湖北省的非武漢城市。而最近的疫情爆出了這幾個(gè)城市的感染人數(shù)都是非常大的,這從另一個(gè)角度佐證了這個(gè)有效距離的有效性。
在之前的一些文章中,有人根據(jù)武漢出發(fā)的交通流量數(shù)據(jù)來估算最容易被感染的城市,這是有道理的,事實(shí)上在我們的數(shù)據(jù)中,有效距離與流量之間有著非常好的負(fù)相關(guān)性:

該圖即佐證了有效距離與流量之間的關(guān)系??梢哉f從武漢出發(fā)到達(dá)某城市的流量越大,則該城市爆發(fā)疫情的時(shí)間就越早。
實(shí)證數(shù)據(jù)是否支持我們的判斷呢?讓我們將疫情數(shù)據(jù)代入進(jìn)來,并計(jì)算得到每個(gè)城市最先報(bào)道病例的時(shí)間,然后去看這一時(shí)間與該城市有效距離的關(guān)系,如下圖:
首先,我們來看有效距離,該數(shù)值可以衡量病毒擴(kuò)散到該城市的快慢和先后順序。我們繪制出首報(bào)病例的發(fā)病日期和有效距離的關(guān)系:

我們采取了兩種擬合方式,一種是忽略湖北省的大部分城市,因?yàn)槲覀儜岩蛇@些城市報(bào)告的病例并不準(zhǔn),很有可能病毒比報(bào)告日期更早地到達(dá)了這些區(qū)域(見下文討論),則可以得到更高的斜率,決定系數(shù)RSquare也會(huì)從0.34提高到0.43。
但是,這種相關(guān)性并不強(qiáng),遠(yuǎn)比《幾何》文章里匯報(bào)的結(jié)果要差。分析原因有可能有三個(gè):一是《幾何》一文大多匯報(bào)的是全球尺度、國(guó)家級(jí)別的傳播事件,利用航空數(shù)據(jù)做估算會(huì)比較準(zhǔn)確。而我們的流量數(shù)據(jù)可能不夠準(zhǔn)確,在基本假設(shè)上也可能不滿足該文的要求。二是可能縱坐標(biāo)的這種病例確診時(shí)間遠(yuǎn)比疾病的首達(dá)時(shí)間要晚很多。而且,對(duì)于部分湖北省內(nèi)城市,這一偏離可能會(huì)非常大。
為了驗(yàn)證這一猜測(cè),我們可以用 “nCoV疫情地圖”項(xiàng)目組提供的包含了病人自己匯報(bào)的感染日期來計(jì)算的首報(bào)病例時(shí)間來進(jìn)行作證。

該圖中,橫坐標(biāo)同樣是有效距離,縱坐標(biāo)則是清華數(shù)據(jù)中病例匯報(bào)的感染時(shí)間(如果這一數(shù)據(jù)缺失,則我們?nèi)匀挥么_診時(shí)間補(bǔ)充)。在該圖中,我們能明顯看出長(zhǎng)沙、深圳、溫州等市匯報(bào)的日期要比一般城市的匯報(bào)日期更短。因此,我們懷疑,湖北的城市有明顯遲報(bào)的現(xiàn)象。因此,我們?cè)谧龅诙l擬合線的時(shí)候,忽略了這些城市。特別是對(duì)于圖4,忽略之后的擬合線的斜率達(dá)到了17左右,這個(gè)數(shù)量級(jí)是與《幾何》一文中一致的。
除了驗(yàn)證這一關(guān)系外,我們還可以得到一些預(yù)測(cè)結(jié)果。如圖3中,右側(cè)部分延展出去的城市都是一些目前尚無報(bào)告病例,而我們根據(jù)外推估算出來的首發(fā)病例報(bào)告時(shí)間,例如北屯市將在1月25日左右發(fā)現(xiàn),而昆玉市將可能在29號(hào)左右發(fā)現(xiàn)。
二、病毒爆發(fā)趨勢(shì)
《幾何》一文還給出了一個(gè)交通網(wǎng)絡(luò)上的病毒擴(kuò)散傳播模型,該模型是在SIR模型的基礎(chǔ)上改進(jìn)而得到的,其方程如下:

其中jn是n城市感染比例;Sn是n城市疑似人群比例,rn 是n城市恢復(fù)健康或死亡的人群比例。α,β,γ 都是參數(shù)。下面,分別進(jìn)行解釋并給出取值說明。


該圖橫坐標(biāo)為從1月10日(我們數(shù)據(jù)中的第一個(gè)確診病例日期)開始的時(shí)間,單位是天??v坐標(biāo)是不同城市中感染人口。我們挑選了一些武漢周邊的城市和北京、上海、廣州、深圳這樣的大城市,將實(shí)際數(shù)據(jù)與模型計(jì)算的結(jié)果進(jìn)行了比較(由于實(shí)際情況是指數(shù)增長(zhǎng),故而,我們將縱坐標(biāo)軸取了對(duì)數(shù))。我們發(fā)現(xiàn),模型與數(shù)據(jù)吻合得非常好。這說明我們的模型是可用的。
接下來,就讓我們看看,當(dāng)保持這組參數(shù)不變,也就意味著如果我們不采取任何措施的情況下,病毒擴(kuò)散的情況:

該圖就是病毒在無任何限定條件下的擴(kuò)散傳播情況,幾個(gè)選出來的觀察城市用不同顏色較清晰地繪制而出,而所有城市用了比較淡的顏色作為背景繪制而出形成一個(gè)帶形區(qū)域。另外,目前我們能夠得到的數(shù)據(jù)也繪制在了同一張圖上,用圓圈點(diǎn)表示(左下角)。從這張圖中,我們能夠得出以下一些結(jié)論:
在不采取任何措施的情況下,現(xiàn)在疾病的擴(kuò)散仍然處于非常早期的階段(左下角);而真正的指數(shù)增長(zhǎng)大爆發(fā)要到大概距今20天左右的時(shí)間才到來。
在自然條件下,疾病最終退去要等到距今大概120天以后,也就是5月底將近6月。
感染人口最多的城市將是北京,而非武漢,這是因?yàn)楸本┤丝诨鶖?shù)更大;而其他幾個(gè)大型城市的感染人數(shù)都會(huì)比武漢多??v坐標(biāo)的數(shù)字是10的7次方數(shù)量級(jí),這意味著,如果我們不控制疫情的話,感染人數(shù)將達(dá)到千萬量級(jí)。比如北京峰值會(huì)接近1千6百萬。
對(duì)于我們關(guān)注的城市來看,疾病擴(kuò)散會(huì)明顯存在著兩個(gè)峰,第一個(gè)峰是以武漢為首的湖北境內(nèi)城市,將會(huì)在45天后左右到達(dá)高峰;第二個(gè)峰則是以北京、深圳等大城市為主的,這個(gè)峰得到來會(huì)比武漢推遲將近10天左右。因此,大致可以說,北京、廣州等大城市在“拷貝”十天前的武漢的發(fā)展情況。
這表明我們的管控措施絕對(duì)是必要的,我們要積極配合。
三、疾病的干預(yù)與控制
這些結(jié)論可能有些過于駭人聽聞,毛骨悚然了。但別忘了,這是在絕對(duì)自然的情況下。而現(xiàn)實(shí)情況是,我們?cè)缫呀?jīng)全社會(huì)動(dòng)員起來了,我們已經(jīng)對(duì)疾病的傳播進(jìn)行了干預(yù)和控制。那么,如果將這種干預(yù)控制引入到我們的模型中會(huì)帶來什么效果呢?接下來,就讓我們來建模這種情況。
首先,我們將介紹我們的建模思路。在基于(1)式的基礎(chǔ)上,我們引入了一個(gè) ξ 項(xiàng),如下式:

這個(gè) ξ 項(xiàng)就模擬了我們?nèi)藶楦深A(yù)、控制疾病傳播的因素。首先, ξ 是一個(gè)介于 η 到1之間的小數(shù)乘到了(1)式中的交互作用項(xiàng)上面了,和 α 起到了等同的作用,直接影響健康者與感染者的交互概率。其中 η 是我們?nèi)藶榭刂颇苓_(dá)到的最小值,這個(gè)可以根據(jù)能夠達(dá)到的最小的基礎(chǔ)再生數(shù)估算出來(后面詳細(xì)給出)。這個(gè) ξ 是 t 的函數(shù),并且由一組參數(shù):t0, tm 和 η 來控制,也就是說 ξ 會(huì)隨著時(shí)間 t 而變化。
為了形象化看到 ξ 的作用,我們還是繪制出了圖形:

我們觀察這個(gè)曲線,有兩個(gè)關(guān)鍵拐點(diǎn),一個(gè)是開始顯著下降的點(diǎn),這個(gè)點(diǎn)由參數(shù)t0來刻畫,表示我們?nèi)珖?guó)開始對(duì)疾病進(jìn)行了干預(yù)控制,上圖曲線,t0=20;第二個(gè)拐點(diǎn)是曲線顯著接近于0.1的時(shí)間(從t0開始計(jì)時(shí)),這個(gè)時(shí)間長(zhǎng)度就是我們最終完全將疾病控制住所需要花費(fèi)的時(shí)間,用參數(shù)tm來刻畫。在上面的曲線中,tm=50。
那么,這些參數(shù)怎么取值呢?見下表:


橫坐標(biāo)為時(shí)間(1月10日為原點(diǎn)),縱坐標(biāo)為每個(gè)城市感染人口的數(shù)量。在這種情況下,我們可以看到,各個(gè)城市基本都將會(huì)在一周內(nèi)達(dá)到峰值。且武漢感染最多可達(dá)2500人左右就開始回落,而深圳市將會(huì)達(dá)到500左右,其它城市均不到500。而最終感染完全消失要到差不多距今80天以后。
那么,如果更合理一些,我們的管控措施并不能很快地將全國(guó)人民動(dòng)員起來,可能要等到一個(gè)月以后才達(dá)到目標(biāo)效果(基本再生數(shù)降低到原來的1/4),那么,得到的模擬曲線是:

與前面的曲線比,形狀沒有發(fā)生很大變化,但是峰值會(huì)明顯延后和提高。大概將在距今10天后達(dá)到(這一數(shù)字和鐘南山最新的估計(jì)是差不多的),最高到達(dá)接近7000的人數(shù),深圳、廣州等差不多落后3-5天達(dá)到峰值,差不多2000。然而該疾病再過了峰值以后仍然會(huì)維持相當(dāng)長(zhǎng)時(shí)間的時(shí)間,該疾病擴(kuò)散將維持到80天以后,即到4月份。
其實(shí),這一情況也有可能出現(xiàn)。雖然我們生活在大城市的人都接觸這方面消息非常多,因此比較謹(jǐn)慎,管控效果很好。但是,考慮到絕大多數(shù)偏遠(yuǎn)地區(qū)、小城鎮(zhèn),則人們可能普遍意識(shí)不夠強(qiáng);抑或者過幾天的春運(yùn)高峰的到來也有可能會(huì)增加人們交互的比例,而出現(xiàn)這種情況。
下面讓我們考慮最糟糕的一種情況。假設(shè)我們需要100天(3個(gè)月多)的時(shí)間,將疾病基礎(chǔ)復(fù)制數(shù)控制在原來的1/4,則會(huì)出現(xiàn)下面的情況:

這其實(shí)與沒有控制的情況差不多。疾病將在大概50天后達(dá)到峰值,而且廣州、深圳的峰值會(huì)遠(yuǎn)比前面的情況高,武漢、廣州等城市最高可達(dá)600萬不到的感染人數(shù)。
在第一種比較保守的估計(jì)情況下(即在30天內(nèi)將病情控制?。覀兛梢杂?jì)算全國(guó)總的感染人數(shù)和死亡人數(shù)。我們用病死率來估算死亡人數(shù),考慮到隨著人們治療該病的手段及其疫苗的研制會(huì)逐步提升,我們假設(shè)最終該病平均的致死率按照3.1%來計(jì)算,那么可以得到全國(guó)相應(yīng)的累積死亡人數(shù)曲線。我們將全國(guó)總感染人數(shù)、累積康復(fù)人數(shù)和累積死亡人數(shù)繪制成如下圖:

即累積感染人數(shù)總量將達(dá)到3萬5千人,死亡人數(shù)將接近1200人。這個(gè)數(shù)字看起來可能偏向保守,但是如果我們考慮如下因素也有可能正確:
大量確診病例很有可能會(huì)被最終治愈,但目前仍然在醫(yī)院中觀察,故而可能我們估算的死亡比例會(huì)過高了;
隨著我們對(duì)病毒的認(rèn)識(shí),以及疫苗的研發(fā),將會(huì)使得死亡率大大降低,從而導(dǎo)致我們的這個(gè)數(shù)字估計(jì)過高。
死亡人數(shù)將接近1200左右。
總之,nCov雖然來勢(shì)兇猛,但是如果我們加強(qiáng)管控力度,該病毒還是有可能得到有效控制的。我們期待著這場(chǎng)戰(zhàn)爭(zhēng)最終的勝利。
參考文獻(xiàn):
[1]D. Brockman and D. Helbing: The Hidden Geometry of Complex, Network-Driven Contagion Phenomena, Science 2013
[2] J. M. Read, J. R. E. Bridgen, D. A. T. Cummings, A. Ho, C. P. Jewell, Novel coronavirus 2019-nCoV: early estimation of epidemiological parameters and epidemic predictions, Preprint in MedRXiv 2020.
[3] 周濤文章:
https://new.qq.com/omn/20200126/20200126A08P9W00.html?pc
數(shù)據(jù)來源:
1、疫情數(shù)據(jù)由澎湃新聞美數(shù)課整理提供 ,并參考“nCoV疫情地圖“項(xiàng)目組整理的疫情數(shù)據(jù)
2、2016年百度遷徙數(shù)據(jù)
3、2020年百度遷徙部分比例數(shù)據(jù)
項(xiàng)目地址:
在此我們公開本研究的GitHub項(xiàng)目,歡迎大家找到我們的錯(cuò)誤,并批評(píng)、挑戰(zhàn)這個(gè)模型,項(xiàng)目地址為:
https://github.com/jakezj/hidden_geometry_of_nCoV
我們的數(shù)據(jù)來源有限,如果大家有更精確、更詳細(xì)的相關(guān)數(shù)據(jù),請(qǐng)聯(lián)系相關(guān)負(fù)責(zé)人微信:18621066378
附錄:
有關(guān)有效路徑的進(jìn)一步解釋:
具體來說,如下圖,假設(shè)從A到B及其周圍城市的交通路徑(可包括飛機(jī)、火車、汽車等一切手段)如左圖所示,而其流量大小如連邊上的數(shù)字所示。當(dāng)我們計(jì)算有效距離的時(shí)候,我們先要將連邊上的流量數(shù)字轉(zhuǎn)化為占比數(shù)字,即從A到B的流量所占從A出發(fā)的所有流量的比例,如右圖所示。

這個(gè)時(shí)候,我們就能計(jì)算有效距離了。例如,A到B的有效距離就是
d(A-->B) = 1 - logP(B|A)=1-log7
為什么要取對(duì)數(shù),為什么又要減1?這個(gè)請(qǐng)聽我在線上講座的解釋(講座視頻錄像見文末):為什么病毒擴(kuò)散這么快?從網(wǎng)絡(luò)科學(xué)視角看大規(guī)模流行病傳播。
然后A到C的有效距離可以這樣來算:

當(dāng)兩點(diǎn)之間存在著多條路徑的情況下,我們可以遍歷所有路徑,并用有效距離最短的一條作為最終的兩點(diǎn)間的路徑長(zhǎng)度,如下面的從A到D的例子:

致謝:
感謝董磊、章彥博、網(wǎng)友烏克里協(xié)助數(shù)據(jù)建模分析,感謝“澎湃新聞美數(shù)課”、“nCoV疫情地圖“項(xiàng)目組、百度遷徙、丁香園的數(shù)據(jù)源。
作者:張江
審校:劉培源
編輯:趙千里
推薦視頻
2013年Dirk Brockman等人在Science上發(fā)表的The Hidden Geometry of Complex, Network-Driven Contagion Phenomena一文就指出疾病的傳播其實(shí)與城市間的地理距離沒啥關(guān)系,而與城市間的“等效”距離密切相關(guān)。這里的等效距離就是指根據(jù)城市間交通流量數(shù)據(jù)而折合以后的距離。北京師范大學(xué)張江老師錄制了視頻解讀這篇論文,供感興趣的讀者參考。
課程鏈接:https://campus.swarma.org/play/play?id=11116
我們也在針對(duì)武漢到全國(guó)各大城市之間的流量數(shù)據(jù)做分析,歡迎感興趣的朋友參與,詳情請(qǐng)見推文《新型冠狀病毒通過交通流的傳播數(shù)據(jù)推演(含公開數(shù)據(jù)集)》。
原標(biāo)題:《防控力度多大才能遏制疫情發(fā)展? 網(wǎng)絡(luò)動(dòng)力學(xué)推演給你答案》
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




