毕业论文
您现在的位置: 遥感 >> 遥感市场 >> 正文 >> 正文

我国农业科学数据共享协议

来源:遥感 时间:2023/5/9
治疗白癜风的中药方 http://m.39.net/pf/a_4769864.html

我国农业科学数据共享协议

陈异凡1,2,闫燊1,3,杨亚超4,胡林1,3,樊景超1,3,张翔鹤1,3,周国民1,5

1国家农业科学数据中心,北京

2北京农学院计算机与信息工程学院,北京

3中国农业科学院农业信息研究所,北京

4山东两仪律师事务所,山东菏泽

5中国农业科学院农田灌溉研究所,河南新乡

摘要:针对我国农业科学数据共享的实际情况,分析了国内外现行多种许可证的特征,以及其在我国农业科学数据共享情况下的适用性。结合我国现行知识产权体系、法律体系、科学数据管理机制、科学发展水平等实际情况,提出了适合我国国情的科学数据共享协议——魏公村科学数据学术/通用许可证(草案)和未来适用范围建议。

关键词:农业科学数据;数据确权;数据共享;共享协议;许可证

论文引用格式:

陈异凡,闫燊,杨亚超,等.我国农业科学数据共享协议[J].大数据,,8(1):46-59.

CHENYF,YANS,YANGYC,etal.AgriculturalsciencedatasharingprotocolinChina[J].BigDataResearch,,8(1):46-59.

0引言

科学数据在人类认识自然、社会以及自身的过程中,发挥了极为重要的作用。当前科学研究已经进入第四范式时代,数据资源已成为国家战略资源的重要组成部分,同时也是支持科技创新的重要元素。获取海量科学数据成为诸多科学研究顺利开展的基本前提。

科学数据共享指科学数据在数据提交者与使用者之间,通过各种形式进行的交流、分享和再利用行为,其目的是扩大和提高科学数据在学术和商业中流通再利用的规模和水平,实现科学数据内在价值最大化。作为科学研究活动的重要基础,科学数据共享有极为重要的作用:在服务科学价值产出方面,其有利于加快科研进程,提高科研水平和科研成果质量;在资源利用效率方面,科学数据共享能够有效避免科研经费的重复投入和科研人员的重复劳动,在促进科学数据流通的同时,加深不同领域科学家之间的合作,实现科学数据的有效利用,提高科研资源的利用效率;在市场经济发展方面,随着对数据资源的深入挖掘和转化,大数据时代的商业应用应运而生;在国际合作方面,科学数据资源的开放共享有利于推动国际间的合作与信任,并开展各项重大科研项目,这对人类充分认识和解决与自身命运相关的重大自然和社会问题具有重要作用。

但是,目前科学数据共享过程中,对权责明确和权属保护的基础不足,进而阻碍了共享。共享协议作为科学数据权属保护体系的重要组成部分,能够有效助力实际工作。因此,本文根据农业等科学数据的自身特征和应用场景,构建科学数据共享协议,有利于对科学数据的权属进行保护,对使用行为进行规范,为追责提供依据,进而助推科学数据共享事业的发展。

1我国农业科学数据共享情况

近30年间,随着科学研究范式的演变、网络和计算机技术的发展,科学数据的产量和共享条件逐渐成熟,因此,对于整个社会来说,科学数据共享还是一个相对较新的事物。尤其在我国,由于社会化共享等理念尚未形成,农业等科学数据共享情况仍不理想。

农业科学数据是科学数据中重要的组成部分,是支撑我国农业科技进步的重要因素。由于农业是我国诸多自然科学中门类最多、地域分布最广、研究历史最长、团队组成最复杂的学科,农业科学数据具有领域广、场景多、格局散等特征,相对于其他科学数据,其共享受到进一步的制约。地理、生态、遗传、经济等各科学与农业场景进行交叉和融合,形成了农区、资源环境、育种、农业经济等子门类,通过涉密、公开、商业等各类性质的支撑项目,产出了遥感、基因、土壤、田间、统计、供求等科学数据,涵盖了图像、序列、表格等上百种文件格式,服务我国农业从微观到宏观研究的各个方面。因此,格外复杂的数据格局导致农业科学数据权属复杂,加大了共享难度。据国家农业科学数据中心统计,目前农业科学数据共享率不足1%,是美国农业科学数据共享率的1/6。为了促进我国科学数据共享事业的发展,我国政府和科学界不断加大对科学数据共享体系的投入。目前,我国已经建立了以国家农业科学数据总中心为首,作物科学、动物科学与动物医学、热带作物科学、渔业科学、草地与草业科学、农业资源与环境科学、植物保护科学、农业微生物科学、食品营养与加工科学、农业工程、农业经济科学、农业科技基础、果树科学、生物安全14个领域分中心为支撑,20个省级服务中心为依托的农业科学数据共享体系。目前开放共享数据量近TB,年服务用户近7万人次。

2共享协议在农业科学数据共享中的价值

2.1农业科学数据共享与农业科学数据确权

科学数据是一种以公共物品和准公共物品属性为主,兼具部分私有物品属性的社会资源,天然具有社会化配置的需求,但同时面临公共物品都面临的“公地悲剧”问题:公共资源往往会导致各使用者倾向于机会主义行为,肆无忌惮地索取而不贡献,导致公共资源快速枯竭。这体现在科学数据领域,就是科学研究者们不积极主动进行数据共享,仅乐于获取他人共享的数据。

“科斯定理”指出,明晰的产权界定可以帮助资源交易双方(生产者和使用者)充分减少对未来预期的不确定性,进而杜绝或降低机会主义行为,从而有效合理地配置资源,这是解决“公地悲剧”的有效途径。在科学数据领域,可通过进一步明确科学数据所有、署名、修改演绎、传播等一系列权责,实现数据确权。这使得生产者、共享者和使用者对科学数据共享过程中的各个关键环节有明确、清晰的行为依据,帮助其消除因权责不确定而产生的顾虑,进而促进科学数据共享事业的发展。

农业科学数据源头繁多、种类多样、领域广泛,农业科学研究者(科学数据使用者)的组成队伍庞大、人员结构复杂、权属意识不一;这种情况下,单纯寄希望于数据管理者对农业科学数据共享进行中心化的统一精细管理不现实,仍需通过发展去中心化、能够高效传播的权属保护方法进行辅助管理,从而引导数据生产者和使用者介入管理之中。而由于农业科研人员中存在大量一线农业技术推广人员、经验农户等“土专家”,其受教育水平普遍有限。因此,农业科学数据权属保护在进行去中心化的过程中,应更多依赖于生产者选择有效、灵活的确权和保护方法。

2.2共享协议是农业科学数据确权及保护的重要手段

虽然目前我国已有《中华人民共和国科学技术进步法》《中华人民共和国促进科技成果转化法》《政务信息资源共享管理暂行办法》《科学数据管理办法》等法律法规,这些法律法规为科学数据共享工作提供了依据。但是,这些法律法规更多重视全盘考虑,偏向政府支持下的科学研究,对具体共享流程中各方权责的规范不足。在实际工作中,不仅需要政府不断完善立法并严格执法,还需要发挥科学工作者的自身能动性,更需要调动科学数据生产者的科研积极性。因此,以“平等自愿”为基础、以《中华人民共和国民法典》及相关知识产权法律法规为依据,明确各方权责,服务农业等学科的科学数据确权及保护,有利于实际农业科学数据共享工作的开展。

3我国农业科学数据共享协议应用现状

3.1现有共享协议基本情况

我国现有科学数据共享协议一般可以分为许可证式共享协议和非许可证式共享协议两类,具体情况见表1。

从表1可以看出,许可证式共享协议通过系统设计和研究,以法律法规为依托,形成了较为完善、自洽的声明和条款。其一般用于数据、源代码等知识产品中,以单独文本文件为载体对使用者进行授权声明,可传播性和可保护性都较好。虽然许可证式共享协议的设计难度较高,但设计完成后,对数据生产者、共享者、共享管理者和使用者都极为友好,有利于后续追责。

目前,科学数据领域的非许可证式共享协议主要可分为合同式、声明式、援引式等。合同式共享协议往往在对非公共领域的科学数据进行点对点共享时使用,一般基于“一交易一合同”的模式,采用商业合同作为载体来约束双方权责,灵活性高,保护力强,但是可传播性差。声明式共享协议一般指公共领域的科学数据在进行数据共享的同时,在数据中心页面针对数据权责进行简单声明。声明式共享协议简单、方便,但是往往缺乏严谨的法律依据和思考,也缺少统一的格式,不仅时常由于数据使用者缺乏耐心没有认真阅读理解而失去声明的意义,而且事后也难以通过声明进行追责,可传播性和可保护性都较差。援引式共享协议大多直接援引其他声明或者法律条款等,常见环境与声明式类似,优劣势也与声明式共享协议类似。但是,数据使用者必须额外投入时间和精力成本,通过跳转、自行查阅等方式了解援引内容。而援引内容存在时刻变更、丢失和解释错误的风险,导致其实际保护效果比声明式共享协议更差。

3.2共享协议应用现状

3.2.1国家科学数据中心的共享协议应用情况

目前国家农业科学数据中心等20个国家科学数据中心是我国科学数据管理和共享的主体。虽然各中心主要管理和共享的数据有领域、学科、类型等差异,但是在权属和共享方面的问题具有相通性,采用的方法也有互相借鉴的价值。因此,本文调研并统计了目前20个国家科学数据中心采用的协议,发现仍主要以声明式共享协议为主,重点针对的权责主要为署名权、演绎权和使用权。20个国家科学数据中心现有共享协议的基本情况见表2。

可以看到,除国家青藏高原科学数据中心和国家冰川冻土沙漠科学数据中心使用CCBY-SA-4.0外,其他中心大多使用声明式共享协议。并且不同中心对科学数据权属的声明差异极大,尤其是复制和传播方面,空间、地球系统、林业和草原等中心完全禁止复制和传播,而基因组、人口健康、农业、气象等中心对此则未加限制。事实上,复制、传播等行为所需成本极低,违约追责也基本不可能,因此对其进行限制意义不大。而且在实际使用过程中,常常遇到必须迁移使用环境、课题组内合作共享等实际情况,使得使用者必须对数据进行复制,很难要求使用者严格遵守共享协议。对于其他关键性的演绎(改编)、商业应用、完整性等权利,以及基于该数据进行二次生产后的新数据中权责的继承关系,各科学数据中心的现有声明规定不完善、不统一。这不仅加大了使用者依据声明合理使用多个中心资源时的难度,也间接导致了权属保护的追责难度提高。

3.2.2其他形式共享农业科学数据的应用情况

在国家科学数据中心之外,我国还存有大量规模较小的共享科学数据资源。以农业领域为例,中国土壤科学数据库、中国作物种质信息网、国家水稻数据中心等或者未采用共享协议,或者采用简单的声明式共享协议。另外,《中国科学数据》等以数据论文等形式提供科学数据共享的服务者则选择CCBY-SA-4.0作为共享协议。

3.2.3适用于我国农业等领域科学数据的共享协议类型选择

由前文可知,目前我国农业等科学数据共享协议普遍采用声明式,部分引入了许可证式,少量采用援引式,而合同式主要在线下应用。主导我国科学数据共享的国家科学数据中心,目前大多使用声明式共享协议,不仅传播性、保护性差,权责追溯价值较低,而且彼此间条款、权责规定差异巨大,容易导致使用者认知混乱,无法正确依约使用数据。而许可证式共享协议由于兼具通用性和灵活性,又可跟随数据同步传播,保护效果也较好,具有明显优势。

3.3现有许可证式共享协议的适用性

目前,随着网络时代信息交互速度的提高,以及知识价值不断被认可,许可证式共享协议不断发展。尤其在开源运动下,以源代码为主要保护领域的许可证种类不断丰富,助推了信息产业中的知识共享。目前,信息产业中广泛应用的Linux、Hadoop、MySQL等重要基础设施都是在许可证的保护下发展起来的。在国外,已经形成了多例依据许可证进行诉讼的法律案件。年9月,我国广东省深圳市中级人民法院也进行了一例关于GNU通用公共许可证(GNUgeneralpubliclicense,GPL)的判罚(()粤03民初号)。在该诉讼中,被告未按照GPL规定使用代码,而司法部门认为GPL具有合同属性,属于《中华人民共和国合同法》的调整范围,并依据《中华人民共和国民法总则》第一百五十八条,对被告进行了侵权判罚(现《中华人民共和国民法总则》《中华人民共和国合同法》已并入《中华人民共和国民法典》)。

但是,业内广泛使用的GPL、MIT许可证(MITlicense)等诞生于海洋法系背景之下,而我国属于中国特色社会主义法律体系,这些舶来许可证在国内使用,难免会遇到“水土不服”的问题,无法确保其约定的权责均可被司法认可。例如,年,北京市高级人民法院驳回了某公司依据GPL继承性(传染性)做出的免责辩护,在该案例(高民(知)终字第号)中,虽然司法机关默许GPL的法律效力,但是对GPL中约定的继承性权利存在认识差异。

为了改善该情况,年8月,北京大学牵头,首次在源码领域制定并发布了我国自己的许可证式共享协议——“木兰宽松许可证”和“木兰公共许可证”,目前二者均已更新至第二版,并通过了国际开源促进会(OpenSourceInitiative,OSI)的认证。该协议针对我国法律体系进行了适配,并被后续多个国内外开源软件项目所使用。

目前国内常用许可证式共享协议的关键权责差异见表3。这些许可证大多针对软件源码场景进行设计和开发,若用于数据领域,尤其是科学数据领域,其场景存在差异。而目前被应用于数据领域的知识共享协议4.0(creative

转载请注明:http://www.0431gb208.com/sjszlff/4670.html