《中国开放数据白皮书》首发:78%受访者赞成公开研究数据

发布时间:2024-11-30 13:02:00 来源: sp20241130

   中新网 北京11月30日电 (记者 孙自法)由中外机构合作推出的首份《中国开放数据白皮书》——《中国开放数据白皮书2023》11月30日对外发布,该白皮书显示,中国科研群体对开放科学有较高的接受度和支持度,有78%的受访者赞成公开研究数据成为惯例。同时,数据共享仍存在诸多阻碍因素。

《中国开放数据白皮书2023》封面。施普林格·自然 供图

  2023年是施普林格·自然(Springer Nature)连续第八年与数字科研(Digital Science)公司、数据分享(Figshare)知识库联合开展有关开放数据的年度全球调查,并据此于本月中旬发布2023年度《开放数据状况报告》,全球共有6000多名研究人员对调查作出回复,其中印度(12%)、中国(11%)和美国(9%)的回复比例最高。

  中国科学院计算机网络信息中心获得授权,对2023年度《开放数据状况报告》中来自中国研究人员的调查结果进行分析,并撰写完成《中国开放数据白皮书2023》,并在当天由施普林格·自然、数字科研、数据分享知识库和中国科学院计算机网络信息中心携手发布,其主要数据分析结果如下:

  ——中国科研群体对开放科学有比较高的接受度和支持度,有78%的受访者赞成将公开研究数据作为常规惯例;全球持这一看法的受访者比例为81%。

  ——对于中国受访者而言,提升学术认可与影响力是最重要的数据共享驱动因素。有56%的中国受访者认为其共享数据获得的学术认可“太少”,持这一看法的全球受访者比例为60%。认可依然是研究人员持续担心的问题,并在过去8年历次《开放数据状况报告》中不断被提及,这损害了激励机制、信任和合作,从而阻碍了开放科学的推进和可持续的数据共享实践。

  ——只有26%的中国受访者表示知道“数据管理计划”的概念,49%的人表达需要相关培训支持,全球也仅有43%的回复者知道什么是“数据管理计划”。

  ——49%的中国受访者表示重复使用过他人或团队公开共享的数据,全球受访者比例为36%。

  ——已发表的论文是中国科研人员(69%)和全球科研人员(49%)最主要的数据获取方式,其次为数据存储库。

  ——多数中国受访者认为中国对于研究数据开放共享给予了较强力度的支持(65%),全球则有近四分之三的受访研究人员表示未获得共享数据所需的支持。

  ——人工智能(AI)意识尚未转化为行动,虽然近半受访者了解用于数据收集、处理和元数据创建的生成式AI工具,但大多数人尚未加以使用;较多的中国受访者已在使用AI工具辅助他们进行数据收集(62%)、数据处理(55%)和元数据创建(53%)工作。

  数据共享存在的诸多阻碍因素方面,中国有57%的受访者担心数据“包含敏感信息或数据共享前须获研究参与者许可”。中国受访者担忧的其他问题还包括“数据滥用(39%)”,“其他实验室抢发研究成果(36%)”,以及“不确定数据版权和数据许可(36%)”等,只有约10%的受访者表示对数据共享没有顾虑。

  在参与此次调查的中国受访者中,60%来自高校,是占比最高的人群,其他为医院或医疗组织(16%)、研究机构(14%)等;在学科分布上,从事医学(29%)研究的受访者比例最高,其次是生物(18%),工程(9%)和地球与环境科学(9%)领域;从职业阶段分布上看,约有47%的受访者处于职业早期(于近5年内发表第一篇论文)。

  2023年该调查首次询问受访者使用AI收集和共享数据的经验。中国科学院院士、中国科学院生物物理研究所研究员陈润生表示,科学数据的开放、共享和应用,会促进科学界带来新的知识,而大数据、人工智能和大模型的融合发展,也将激活科学研究的创新力和生命力,破解更多科学密码。

  《中国开放数据白皮书2023》还邀请中国数据开放共享领域的专家参与报告撰写,从国家政策法规体系、科研评价体系、科研机构的指导作用和数据共享最佳实践等方面提出相关建议。作为全球知名学术出版机构,施普林格·自然也介绍了其在中国的数据政策、相关实践及愿景。

  施普林格·自然科研市场总裁史蒂文·印驰库姆(Steven Inchcoombe)称,开放数据状况报告是一项全球调查,旨在深入了解科研人员对于开放数据的态度和体验。“我们很高兴与中国科学院计算机网络信息中心携手,合作发布一份有关中国开放数据情况的报告,以便出版机构、科研资助机构和科研机构更好地了解科研人员的看法,以及需要以哪些支持来帮助他们将数据公开”。

  据了解,开展有关开放数据的年度全球调查,其研究数据是支撑科研项目、研究或成果出版的文件集合,包括电子表格、文档、图像、视频或音频等。这些研究数据应是开放、可访问和可重用的,以加快科学发现的步伐并有益于社会。而开放数据是开放科学的基本要素,也是支持研究可重复性的关键。(完)

【编辑:房家梁】