北极星

搜索历史清空

  • 水处理
您的位置:环保环境监测气体监测评论正文

预测雾霾 大数据能帮什么忙?

2015-12-14 10:29来源:中国环境报作者:徐丽莉关键词:空气质量重污染天气污染源数据收藏点赞

投稿

我要投稿

大数据预测得准不准?

那么,多元融合的大数据算法与传统的空气模拟预测相比,是否更准确?

“其实,大数据预测与传统模拟方法有一定的相似性,都是通过数据来拟合模型,只不过是数据量大小不同。”郑宇说,以往由于获知的数据有限,传统模拟方法只能基于有限的样本数据,由科研人员通过经验、假设找出这些数据间的规律,模拟出简单的模型,预测空气质量。而随着数据增多,单单依靠人工已经无法从海量繁杂的数据中找出规律,所以需要借助机器学习和数据挖掘等工具来发现多源数据中隐含的规律。

如今影响空气质量的因素越来越多,传统模拟的方法显得“力不从心”。郑宇介绍说,传统模拟空气质量预测首先需要搜集完整的污染源数据,比如企业的排污数据和汽车尾气排放等,而这些数据无法全部获知;其次模型太理想化,污染物在空气中传播和变化的实际情况,要复杂很多。

随着影响空气质量的因素增多,数据量的增大,大数据在空气质量预测上颇有优势。比如传统方法要拿到精确的地面污染源数据才能预测,而大数据则可以解决数据缺失的问题。比如对于交通尾气数据难获取的情况,大数据运算可以采用与交通尾气相关的交通流量、排量等相关数据,间接地分析其与空气质量的关系。“大数据的精髓就是A领域的问题可以借助B领域、C领域、D领域的数据来一起解决,通过多元数据融合的方法来解决数据缺失和不精准的问题。”郑宇说。

空气质量站点、相关领域的数据、大数据先进的挖掘技术和模型,保证了大数据预测的准确性。据了解,现在大数据对京津冀雾霾的预测精度可以达到75%,对成渝等地的预测精度会更高,平均准确率比统模拟方法高15%~20%。

大数据预测还存在哪些困难?

虽然大数据对雾霾的预测已经成功实践,但郑宇也坦言,大数据预测雾霾确实还有很多困难。

数据量少是大数据发展的掣肘,大数据的预测是基于对大量的数据进行学习。但我国数据开放进程比较晚,并且很多污染源数据都还不完善。

“数据量大小直接影响大数据预测的精准度。”郑宇说,比如数据样本量不够,会导致雾霾的拐点很难预测,目前传统经典模型和大数据模型都很难说清楚雾霾何时会消散。“很多人认为大风来了,雾霾一定会散去,真实情况并非如此,雾霾消散与大风的强度、持续时间、风向来源地都有非常大的关系。比如,如果风向的来源地本身是污染源,那么雾霾不但不会散去,反而会加重。”郑宇说,目前有关拐点出现次数的数据特别少,可能一百天出现一次,对简单的统计学模型来说,拐点出现就是少数派,模型很难预测拐点。目前,郑宇和他的团队也在单独对拐点进行建模,准确度已经提高到30%。

针对大数据在环保领域未来的发展,郑宇认为国家首先要培养数据科学家,不仅仅是懂大数据挖掘算法,还要动行业知识,这样才能把大数据转化为生产力。其次,大数据时代要求政府开放数据。只要数据足够,未来工业园区的建设与空气质量的变化情况,整个城市设计与空气质量的变化情况,完全可以依靠大数据实现。

延伸阅读:

重污染预警是一次大练兵

雾、霾预报“出炉记”

原标题:预测雾霾,大数据能帮什么忙?
投稿与新闻线索:电话:0335-3030550, 邮箱:huanbaowang#bjxmail.com(请将#改成@)

特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明北极星*网的内容为北极星原创,转载需获授权。

空气质量查看更多>重污染天气查看更多>污染源数据查看更多>