中国为什么需要通过数据共享来应对空气质量挑战 | nsr专栏
pixabay.com
撰文 | patrick funk 薛澜 梁正等
翻译 | 陈海诺
审校 | 梁正 余振
责编 | 蒋海宇
●●●
在空气污染的防治问题上,与收集数据同等重要的,还有中国国内数据的共享,以及科学家能够基于数据在政策建议上达成共识。人们对社会问题的认识很大程度上受制于公开数据的规模大小:如果数据不能反映整体形势,或者数据之间没有关联,依靠这些有限数据进行的研究,很可能带来错误的结论。
尽管数据共享的优点显而易见,中国在这方面仍面临诸多系统性的障碍。比如,中国以往收集的空气污染数据,多数是失真的。此外,尽管数据共享对科学研究非常重要,但是由于晋升机制和学术评价标准等方面的问题,科研人员对数据共享的积极性并不高。再者,仅仅克服数据共享及协作这一问题还远远不够。正如加利福尼亚空气资源委员会(california air resources board)和休斯敦空气质量管理部门的经验所表明,科学家们还必须聚集起来,依靠这些共享的数据,帮助政府制定合理的政策。
由于数据共享与合作的形式多样,为了阐明此文的观点,我们首先需要明晰数据共享的不同形式。数据共享(data sharing),指的是一个组织的成员们,为一个明确目的,所进行的数据交换。数据共享的形式会随着涉及的研究人员及其所属机构的数量的差异而有很大不同。一个数据共享项目不一定会向公众公开数据。
数据公开则是数据共享最极端的形式,因为它将数据获取的权限开放给所有人。除了数据公开和仅含两个对象的封闭数据合作之外,还存在一种数据共享俱乐部(data-sharing club)的形式,其成员通常基于一系列既定的共有原则上进行数据共享。从历史上看,致力于解决像空气污染这种复杂问题的国际合作,通常都是从一个小组织开始,之后随着项目的发展而不断扩大。相对于单个组织的自行研究调查,数据共享能够帮助回答更多、更复杂的问题。不过,如果没有合理的激励机制,数据共享可能会与学术界传统的数据采集和所有权的文化标准产生冲突。美国休斯顿治理空气污染的经验是一个典型的案例,它在不公开数据的前提下实现了有效的数据共享,我们将会在后文中详细讨论。
数据汇集(data pooling)所建立的数据库,不用于特定研究和政策目标,而是让数据库成员(在极端情况下,甚至让公众)能够随意访问其中的数据。数据汇集可以被认为是数据共享的一种更复杂的扩展形式。在良好的执行情况下,数据汇集可以确保数据的有效性和一致性。通过利用共享资源,数据汇集也可以帮助人们回答更复杂、更深远的问题,也有利于解决人们在科学认知水平提高后提出的新问题,从而带来新的知识。然而,数据汇集一般很难实现,因为它要求所有参与者分享数据,但他们可能已经习惯了独享数据以实现个体利益的最大化。而且,它还需要大量的维护和管理来确保数据始终有效。由远程跨境空气污染公约(clrtap),及气雾、云和微量气体研究平台(actris)创建的数据库,都是数据汇集的典型案例,我们在后文将对它们进行讨论。
难 题
当时,在中美贸易和南海问题争端升级的背景情况下,美国白宫科技政策办公室主任john holdren和中国科技部部长万钢,于2016年6月5日开展了中美创新对话,讨论双赢的合作机会。双方讨论的重点之一便是关于数据共享和合作研究在应对气候变化和空气污染中的作用。
2005年,大气中小于2.5纳米的颗粒物(pm2.5)和臭氧,共造成大约450万人过早死亡。黑碳作为pm2.5的组成部分之一,是全球变暖的主要诱因,其作用仅次于二氧化碳。减少这些污染物不仅会提升空气质量,还会减缓气候变化的速度和程度。要解决这个问题,数据共享是关键。人们对社会问题的认识很大程度上受制于公开数据的规模大小:如果数据不能反映整体形势,或者数据之间没有关联,依靠这些有限数据进行的研究,很可能带来错误的结论。例如,在解释臭氧层空洞时,氯氟烃假说曾受到许多科学家和决策者的质疑,但从不同尺度和平台收集得来的数据最终验证了该假说,新的应对政策也才得以产生。
尽管数据共享和汇集的优点显而易见,中国在这方面仍面临诸多系统性的障碍。比如,中国以往收集的空气污染数据,多数是失真的,而且大部分数据公众无权获取。此外,科研人员的晋升和学术评价标准方面的要求也无形间打压了他们共享数据的积极性。例如,以第一作者或通讯作者发表的科研文章是科研人员获得晋升或长期任职的重要条件,但是一篇文章通常最多只有三个作者能够成为第一作者或通讯作者,而数据分享一般都以第一作者为条件,这就打击了科研人员共享数据的积极性,即使是合作发表也并非有效的凯时尊龙官网的解决方案。
为了最大限度地利用可发表的数据为自己获益,研究者和研究机构一般不会愿意共享数据。由于高质量的空气监测设备由不同的组织所有,而空气污染分析又需要各地区不同地点的高质量数据,中国只有克服数据共享和协作上的阻碍,才能更好地减少和遏制空气污染。
仅仅克服数据共享及协作这一问题还远远不够。正如加利福尼亚空气资源委员会(california air resources board)和休斯敦空气质量管理部门的经验所表明,科学家们还必须聚集起来,依靠积累的共享数据,帮助政府进行决策。如果没有这种知识转移,政策制定过程很容易被误导,带来灾难性的后果。最后,分享和使用数据,也会对数据收集本身有所助益。
历史经验:数据共享框架
面临这些挑战的不仅仅只有中国。国际上的空气质量研究中,强制的数据共享协议仍是比较新颖的举措。在1950年,世界气象组织(wmo)已经开始通过汇集天气、气候和水等领域的数据,以加强国际间的合作。这些早期举措面临不少问题,因为公布数据的过程没有经过检查和权衡,其质量参差不齐,难以用于研究。
wmo把全球大气监视计划(global atmospheric watch)作为一个高质量的数据共享项目,至今仍对公众开放。远程跨境空气污染公约签署于1979年,由欧洲监测和评估计划(emep)实施,它创建了一个共享的数据网络来帮助解决各国的空气质量问题。1983年,为了研究对流层化学及其对美国的影响,nasa建立了全球对流层实验(gte)。gte强制规定把加入数据管理协议作为得到研究资金的必要条件之一,以此确保数据在项目资助方之间共享,以及资金被用于数据管理。该实验实地数据的收集于2001年结束,但其数据至今仍对公众开放,显示了数据汇集和公开的巨大潜在价值。
成立于1997年的eionet,是欧盟国家及其合作国家的一个数据联盟,用以收集、共享和研究环境数据。2011年创建的actris是为了将2000年前的一系列项目(不包括eionet)合并到一个统一的数据库和网络中。actris由欧盟委员会资助,由成员国代表共同管理。actris在网络管理中拥有一套数据和元数据报告的标准(包括位置、仪器、不确定性/百分数等),以保证整个网络数据的质量。
很多顶级期刊也将数据共享纳入其出版要求中。《自然》的政策规定:“在《自然》期刊中发表的文章,作者须向读者无条件公开研究材料、数据、代码和相关协议。”然而,在国际上, 数据共享仍然任重道远,比如美国也还没有类似actris的平台。此外,尽管美国国家科学基金会(nsf)当前要求空气质量监测项目需分享并最终公开数据;但历史上,他们并不允许此类项目参与到数据管理当中。
历史经验:
科学家为决策过程提供帮助
国际上已经有很多先例关于科学家如何为决策过程提供帮助,以及科学家和政府监管机构共享数据的实践如何最终完善空气质量政策。在美国,加利福尼亚空气资源委员会(carb)在推广和资助空气质量研究方面已经有很长的历史,他们在改善全州空气质量方面的成绩常常在美国名列前茅。
20世纪中叶,洛杉矶的空气污染十分严重,其糟糕情况甚至堪比北京现在空气质量最差的时候,年平均pm10达到约150μg/ m3,臭氧峰值超过600 ppb 。而基于氮氧化物(nox)对臭氧空洞和pm2.5的影响的研究结果,carb在全美设立了首个机动车nox标准。由于这些举措以及随后对排放的有效控制,洛杉矶现在的空气污染水平已经下降到当时的四分之一以下,尽管洛杉矶现在的人口已经增加了一倍,车辆里程增加了四倍。在整个加利福尼亚州,仅在过去的23年中,因暴露于主要有毒空气污染物而导致的集体性癌症风险下降了76%。中国政府机构与学术界之间联系紧密,可以借鉴carb的经验,从carb的数据共享模式中获得启发,在国际背景下建立跨境合作项目和机构。
德克萨斯州休斯顿市的空气质量管理经验也从另一个角度说明了学术界和政府之间的合作对于大幅度改善空气质量的重要性。1999年,休斯顿遭遇了美国最严重的臭氧污染,该市启动了一项雄心勃勃的研究合作计划,涉及许多州立的、联邦的和学术的组织。与加利福尼亚情况不同的是,这项研究发现氮氧化物并不是臭氧形成的主要原因,而是认为高反应性挥发性有机化合物(voc)对臭氧的形成更为关键。通过总结超过300位科学家在不同出版物上的研究成果,立法者得到了更为科学有效的政策方案。通过规范高反应性voc而不是nox为产业节省了约10亿美元。洛杉矶和休斯顿的案例充分说明了让科学家参与决策过程以及共享数据的重要性。在两个案例中,由于区域地理和行业差异,用相反的干预措施来减少臭氧也是有理可循的。
历史上,中美双方曾有过将科学纳入政策过程的合作经历。2003年,美国环境保护局和中国国家环境保护局(环境保护部的前身)史无前例地签署了一份关于燃料和车辆技术与标准合作的备忘录。这项合作的数据虽然没有对大部分中国公众开放,但从事这些项目的中美科学家可以共享相关数据,其中部分工作报告也在美国得以发表。2008年,中国国家能源局的大气辐射测量气候研究设备迁至东南地区。这无疑是一个进步,但在该项目尚未收集到足以支撑科学研究或政策启示所需的长期数据之前,就因为数据使用和所有权问题而被迫关闭。
更近的一个例子是,气候变化工作组(ccwg)所属的美中气候与能源合作为“巴黎协定”谈判的成功做出了贡献。ccwg已经开始推动研究机构之间的数据共享。2015年,中国能源模型论坛在清华大学举行,该论坛将建模团队和政策制定者置于同一平台上,以便更好地为决策提供帮助。中国也已经开始创建一个独立的汇总数据库以收集环境数据和由政府数据中心提供的多种来源的综合数据。这些举措对于解决数据分享和科学辅助决策方面的系统性障碍十分有利。
虽然这些挑战并非中国所独有,但作为世界上最大的污染排放国之一,中国拥有独一无二的机会去解决我们这个时代的一些最重要的空气污染和气候挑战,并有可能在这些创新与对话中引领世界。近几十年来,中国在工程和大型基础设施建设方面的创新成就位于世界前列,高速铁路就是一个典型的例子。中国已经拥有世界级的数据基础设施,如果能够向其最优秀的科学家(甚至全球范围内的凯时尊龙官网的合作伙伴)开放这些数据集,使他们能够推动科学发展并为决策者提供科学的政策建议,那么中国很有可能在解决当今全球面临的最严峻的挑战上做出世界领先的贡献。
行动提议
1) 建立奖励机制。以国家奖项为例,比如可以允许不是以第一作者或通讯作者发表的文章纳入到科研人员的绩效考核中,鼓励中国科学家在空气污染研究和政策分析等领域积极参与联合研究并共享重要的数据。
2) 建立目标。比如,所有政府资助的空气污染研究数据,在其收集完成两年之后必须向公众开放或可以被共享。这类目标也可能包括让所有公立的研究机构在数据收集完成两年后向公众开放所有数据。
3) 建立一个通用的共享数据库,搭建基础设施和网络,汇总来自中国各地研究机构站点和政府站点的数据,并整理为通用且高质量的形式。在建立这些基础设施时应时时考虑到空气质量—气候变化—健康的基本关系。欧洲的actris,clrtap或全球大气监测可以作为很好的参考模式。
4) 为那些在应对气候变化方面投入最多科研资金的国家建立一个核心的数据合作平台。国际合作领域的研究发现,在解决具体问题时,较为精炼的组织和较高的初始投资可以加速建立有效合作的过程,并为成功拓展为一个更具包容性的全球模式创造条件。
a) 让相关的国家学术机构(包括来自美国,中国和欧洲的)邀请在空气质量—气候变化—健康关系的研究领域中最优秀的科学家加入蓝带小组(blue ribbon panel),在开发共享数据基础设施和加强政策分析方面进行合作。蓝带小组是一个专家咨询小组,旨在为政策制定提供公正科学的支持。在美国,典型的蓝带小组例子包括肯尼迪暗杀委员会和9/11委员会。相关的例子还有不少,虽然它们不一定对外都被称为蓝带小组,比如美国国家科学院委员会,它发布了具有里程碑意义的研究报告——《站在暴风雨之上》(rising above the gathering storm),并帮助动员建立了能源部先进研究计划项目(arpa-e);再如,美国环保局(epa)科学顾问委员会,它为美国环保局提供了很多关于科学方法和研究计划的建议。
b) 蓝带小组需承诺在(在发表之前)一年内向政策制定者沟通和分享科学家已经达成共识的科学发现。
c) 承诺将来自该网络的数据完全共享和公开。
d) 制定适当的安全保障措施以保障科学的严谨性和透明度,包括及时公布数据。
e) 承诺依据一个时间表,在蓝带小组中体现更多的全球参与。
最后,虽然国际合作可以动员世界各地最优秀的才智帮助解决中国严峻的空气污染问题,但中国若要实质性地改善空气质量,还需在数据共享以及让科学家参与政策制定等方面做出巨大的努力。
致 谢
感谢david allen,michael brauer,greg carmichael,neil donahue,baruch fischhoff,denise mauzerall,tom mitchell,chris nielsen,allen robinson,robert sawyer,jay turner和alfred wiedensohler为本文付出的时间和对文章内容的增益。
英文原文2017年11月发表于《国家科学评论》(national science review, nsr),原标题为“why china needs data sharing to address its air-quality challenge”。nsr是科学出版社旗下期刊,与牛津大学出版社联合出版。《知识分子》获nsr和牛津大学出版社授权刊发该文中文翻译。
原文链接:https://doi.org/10.1093/nsr/nwx059
nsr专栏往期文章精选:
制版编辑 | 皮皮鱼