https://mp.weixin.qq.com/s/7FttuNVJwjjILKa23gJrUg
国家和人一样,不断学习,挺有启发的。其中说到,
现状是 “在中国疾控中心的官方网站上,以“SARS”为关键词搜索出的结果有216条(截至2月16日下午),其中绝大部分是含有“SARS”词条的各种新闻(相当部分新闻的主要内容与SARS无关),但是没有任何一条链接指向与SARS有关的详细统计数据 [1]。
值得一提的是,在疾控中心下属的 “公共卫生科学数据中心” 网站上,研究人员可以通过申请的方式获取包括SARS在内的传染性疾病数据,然而该中心的网站显示,其所收集的SARS数据只包括2004年网络直报以来报告的全部数据,并没有2003年疫情从发展到平息的数据 [2]。
而在资源检索一栏,使用数据资源检索,勾选 “传染性非典型肺炎” 的数据库后,输入2003,点击查询,网页也处于停滞状态,并没有出现任何一个弹窗或提示。实际上,勾选任何一个数据库,多次输入2003或肺炎等文字,点击查询后也没有下一步的提示。”
可以借鉴的是
“复旦大学管理学院统计学系讲师黄达表示: “总的来说,美国CDC对于数据能不能分享、怎么分享、相关的权责等等,有一套规范。这套规范可以在CDC网站自由下载。根据这份规范 [5],数据分为可识别(identifiable)和不可识别(unidentifiable)两种分别处理。能够识别个体信息(也就是我们常说的未脱敏)的数据是需要另外签署保密等协议的。而对于可以面向公众发布的数据,一般是数据质量评估后,或是分享给数据收集伙伴后,一年内通过公共用途数据集形式发布。而且一般对公众发布的信息,是综合后以统计图表形式发布,不涉及个人层面的数据。”黄达所说的规范指的是《美国疾控中心/毒性物质和疾病注册局数据发布与共享政策》(CDC/ATSDR Policy on Releasing and Sharing Data)。”