全国空气质量历史数据是大气环境研究的重要基础资料,而我国官方平台仅提供实时监测信息,而且还只支持IE浏览器(╮(╯_╰)╭)。
我曾尝试采用爬虫工具获取并存储逐时信息,但限于权限,未能在实验室服务器上连续长时间运行。互联网上直接提供数据或API端口的网站有很多,如环境云,PM25.in, 青悦开放环境数据中心等。其中,beijingair最具分享精神,提供了2013年至今的详尽历史数据,且完全免费。
由衷感谢@王_晓磊的出色工作和无私分享,极大地推动了我国环境数据的公开与透明。其数据格式为每日一份csv文件存储当日所有站点/城市的逐时信息。在长时间尺度的数据分析时,需逐一阅读各原始文件。此处,我考虑将全年数据文件整合为多维度数据存储格式(HDF5)文件,便于调用和处理。