全国疫情今天公布的数据_可能会说谎的地图-重新审视全国疫情的地理格局

引言

新冠状病毒肺炎患者在全国范围内有非常广泛的覆盖面,他们的日常变化也很大。由于其固有的时空特征,通过地图可视化流行病数据的空间、时间和数量特征是最常见的方式。然而,因为流行病数据的地图呈现是一个聚集和合成的过程,所以所选择的空间尺度(例如,大规模聚集、小规模聚集等)。),单位类型(如省、市等。),聚类方法(分位数法、标准差法等。)和表示形式(例如,面板密度图、内核密度图等。)都有一定的差异。尽管地图本身是数据分布的客观反映,但由于绩效目标和专业认知的差异,结果是主观和有偏见的。这将不可避免地导致流行病地图上的“谎言”。下面从这四个方面重新审视当前全国疫情的地理格局,将有助于疫情分布图的读者通过地图更理性地了解疫情的现状,而疫情分布图的制作者可以选择更合理的方式来构建疫情分布图。

1地理单元影响

如果不考虑相关性分析,地理单元对疫情图结果的影响主要体现在信息的泛化程度上如图1所示,显示了主要媒体或组织目前采用的主流可视化方法,它们的基本统计单位是省份。从图中可以看出,除了湖南省是一级灾区,除了广西和台湾,中国东部、中部和南部的其他省份都是二级灾区。此外,受影响第二严重的地区包括中国北方的北京和中国西南的重庆和四川。扩散趋势表现出明显的地理邻近效应和高层节点的层级效应。从大地理格局和中央政府高层管理的角度来看,图1基本概括了当前疫情空间结构的基本特征

全国疫情今天公布的数据

图1主流疫情图展示

然而,正如大多数人所熟悉的,市级行政单位一级的数据能够更好地反映真实情况尽管这种流行病的传播在地理上是依赖的,即上文提到的空间邻近效应,但中国数百个城市具有等级结构,而不是平行的区域结构。或者等级结构比区域结构更重要例如,区域性中心城市、省会城市等,都属于高等级节点,远远高于其他普通城市节点。

是图2所示的市级流行图除了整个湖北省,受灾最严重的地区主要分布在邻近的重庆、湖南北部和河南南部其他包括京津冀腹地、长江三角洲和珠江三角洲从某种程度上说,武汉及其所在的湖北省不仅可以被视为整个中国的中心,也可以被视为中部中国的中心。然而,从城市的流行病分布图可以看出,受灾最严重的地区只扩散到中国中部其他省份的边缘地区。对其他省份来说,这种流行病主要在一些城市很严重。值得注意的是,在胡焕庸线以南那些被疫情包围但尚未遭受疫情的孤立岛屿城市。即使在受灾最严重的中部地区,也存在这样的现象。

全国疫情今天公布的数据

图2市一级疫情图呈现方式

总之,在疫情图制作过程中,地理单元的选择对读者对疫情信息的理解仍有很大影响。目前,胡焕庸线以南的地方几乎都被占领了。在预防措施极其重要、公众意识亟待提高的严峻形势下,以更加科学和多样化的形式向社会提供疫情信息也是一项尤为重要的工作。如果涉及影响机制分析,应更多地关注地理单元的选择,以尽量减少可变面板问题对分析结果的负面影响。

2地理比例的影响

除了地理单位之外,比例是流行病制图中需要考虑的另一个问题当不考虑可变面板问题时,地理单元的大小和地理比例的选择也是一致的。此时,共同的影响表现在地图的泛化程度上。专家组的上述介绍有利于捕捉特定的地理单元,但其缺点是难以直观捕捉疫区的空间分布特征和等级特征。如图3所示,示出了确诊病例的核概率密度图。在图3所示的尺度上,灾区的位置、范围和等级可以被清晰直观地捕捉到,甚至哪些疫区属于扩散区,哪些属于迁移和扩散区也可以被非常直接地观察到。毫无疑问,如果我们注意流行病的传播模式,这种绘图方法是最好的。

全国疫情今天公布的数据

图3小尺度流行病概率密度图

值得注意的是,作为影响流行病制图的尺度的一个例子,这里简要介绍尺度的选择及其对流行病表现的影响与图3相比,疫情图是以更大的比例构建的。如图4所示,空间扩展模式一目了然。这是大比例尺疫情图的优点和缺点。似乎图4给出了比图3更直观和有用的扩散模型。从图4所示的规模来看,到目前为止,在较严重的疫区中,珠江三角洲疫区在地理空间上独立存在,而其他几个疫区基本上是联系在一起,成簇成带发展的。

全国疫情今天公布的数据

图4基于地理信息系统场论的大比例尺流行概率密度图

流行密度图由于其不断变化和边界模糊而具有独特的优势,特别是在宏观特征提取和可视化方面这种方法也可用于模拟流行病的时空演变和过程。基于这一思想,作者提出了一些分析城市文化空间扩散和宏观形态特征的有效方法。

3聚类方法的影响

目前,大部分确诊疫情的空间分布图都是按照定制的方式进行分类的一方面,主要原因是大多数地图都是基于省份的,而且数量很少,所以数据的分布可以忽略不计。另一方面,对于在映射过程中采用聚类方法的必要性缺乏深入的理解。事实上,自定义方法用于对已确认的数据进行分级。主要问题是没有考虑数据的总体分布。例如,使用Jenks' Break方法和分位数方法,获得的映射结果非常不同,解释方法也非常不同。图5和图6显示了使用相同的数据和不同的聚类方法获得的流行病分布图的结果。显然,结果大不相同。

在图5中,聚类遵循的原则是“组内差异最小,组间差异最大”根据这一原则,从图中可以看出,武汉的疫情远远超过其他任何城市。其次,武汉周边地区和重庆等几个城市处于第二层次。这些城市的二级病例数量在一定程度上是相似的。可以说,这些城市的病例数远低于武汉,但远高于其他低水平疫区。其他等级的分区也有类似的解释

全国疫情今天公布的数据

图5基于Jenks' Break聚类的流行病分布图

图6显示了基于无百分位的聚类结果这意味着,这些处于一级疫情重灾区的城市,是受灾严重程度最高的20%的城市之一次级城市介于前40%和20%之间例如,乌鲁木齐在40%到60%之间,而哈尔滨在整个东北地区仅排在前40%除了南京和苏州,江苏其他城市都在后60%

全国疫情今天公布的数据

图6基于分位数聚类的流行病分布图

还有许多其他方法,如自定义、等间隔、几何数、标准差方法等。具体选择取决于分析要求。通常,定量聚类方法是定制的,因为大多数聚类方法考虑样本的分布特征更重要的是,地图阅读应该在知道使用哪种方法的前提下进行,尤其是在使用聚类方法时。这样,如果图2的上述解释不理解或考虑所使用的聚类方法,其结论偏差将很大甚至是错误的。

4演示形式视觉变量的影响,如颜色、方向、大小、形状等。用于构建流行病分布图是非常丰富的。然而,对于数量关系,人类的眼睛似乎对大小差异更敏感。不同城市的确诊病例数量差异很大,患病地区的数量也很大。在这种情况下,采用更有利于公众掌握不同地区确诊病例数量的疫情分布图方法尤为重要。图7中所示的

是基于分类符号方法绘制当天所有确诊病例的流行病分布的结果由于分级操作消除了同一等级的数量差异,因此无法捕获同一等级的差异。这是一种对疫情撒谎的地图,事实上,这种情况撒谎存在于上面所有的疫情地图中。解决办法是按照统一的比例象征案件的数量。从那时起,每个城市中病例的数量与符号的大小成正比,并且因为人眼对大小变量极其敏感,所以可以非常直观地捕捉到不同城市中病例数量的差异及其空间分布关系。图8中示出了使用比例分类的映射结果。

全国疫情今天公布的数据

图7分级符号和疫情图

从图8的结果中,我们可以清楚地区分武汉及其邻近地区和其他重灾区之间确诊病例数的差异其他城市不同规模的案例数量及其空间关系也非常清楚。当然,每张流行病地图都有两面。通过这张地图,很难直接区分没有显著特征的城市的具体情况。

全国疫情今天公布的数据

图8比例符号和疫情图

结论

我国正处于疫情最严重的困难时期。作为一名地理研究者和科普工作者,我希望本文能为流行形势下的科普工作做出一点小小的贡献。作为使用疫情图的读者,应该正确理解疫情图,理性思考,积极防范。作为一个流行病地图的制作者,我们应该用专业的素养和严谨的态度来制作流行病地图产品。当疫情随时扰乱国民情绪时,专业精神和理性更为重要。

作者:张海平

来源:爆发地图项目组

大家都在看

相关专题