近段时间,全国范围内尤其是京津冀地区接连陷入雾霾之困,北京更是首次发布空气重污染红色预警,中小学连续停课3天,机动车单双号限行。雾霾的背后,重污染天气的预警预测工作显得尤为重要,不仅可以让公众提前合理安排生产生活,也可以让政府相关部门及时采取应急措施,缓解重污染天气带来的危害。
微软亚洲研究院主管研究员郑宇一直从事大数据挖掘和算法研究,希望用大数据解决现代城市所面临的问题。他和他的团队已经成功用大数据计算出1km×1km细粒度的空气质量状况、尾气排放数据和噪声污染指数。
那么,大数据是如何预测雾霾的呢?
大数据能不能成功预测雾霾?
Urban Air正是由微软亚洲研究院开发,用大数据预测城市空气质量的项目。目前,Urban Air已经实现全国70多个城市空气质量预测,可以对京津冀、长三角、珠三角、成渝城市群未来48小时的空气质量进行预测。
“大数据不仅能预测雾霾,还可以精细化预测。”郑宇说,依靠经典模拟方法预测预警雾霾,只能算出空气质量的均值,而大数据可以对1~6小时的空气质量逐小时进行预测,对7~12小时、12~24小时、24~48小时进行最大值和最小值的预测。
除了在预测精度上有优势外,大数据精细化预测还体现在地域范围上。目前,传统模拟方法预测雾霾只能精细到区的范围,比如可以预测到北京市海淀区、朝阳区的空气质量,而大数据可以精细化到每个空气质量站点,比如可以预测海淀区万柳站点未来48小时的空气质量状况。
大数据不仅能预测雾霾,还可以很快速。据郑宇介绍,传统的重污染天气预测工作需要6小时左右的模拟运算时间,无法快速实时发布,而大数据可以在几秒钟之内快速算出重污染空气质量数据。
未来,雾霾的运行轨迹也将有望实现,雾霾从哪来,到哪去都将不是难题。记者了解到,郑宇和他的团队正在从事雾霾因果相关性的研究,目前还处在研发阶段,预计明年将正式投入应用。
大数据怎么预测雾霾?
既然大数据可以预测雾霾,那么,能够预测雾霾的大数据究竟包含哪些数据?这些数据又如何预测雾霾?
雾霾的大数据主要包括当前空气质量数据、气象条件、未来天气预报3类数据。郑宇特别介绍说,空气质量数据并不是指单纯的空气质量站点数据,而是以某空气质量站点为圆心,囊括了方圆300公里范围内所有的与空气质量相关的数据,比如空气质量站点数据、交通流数据、气象数据、厂矿数据、人口流动数据、路网结构等。
与传统模拟空气质量不同,大数据预测雾霾依靠的是多元融合方法,也就是说,空气质量的预测不仅仅看空气质量数据,还要看与之相关的气象数据、交通流量数据、厂矿数据、城市路网结构等不同领域的数据,不同领域的互相叠加,相互补强,从而预测空气质量状况。
“大数据应用于预测雾霾,首先,由于每个站点、每个时段空气质量的影响因素都不尽相同,所以针对每个空气质量站点,我们都会为这个站点每个时段单独建一个空气质量模型,之后再将三者数据叠加,最后将数据进行融合,制作出空气质量预测模型。”郑宇说 ,这样算下来 ,为预测北京市空气质量,建立的模型已经达上百个。