Advertisement

The Intellectual Property in the Age of Artificial Inte

阅读量:

作者:禅与计算机程序设计艺术

1.简介

这是一篇关于创客时代知识产权保护、数字化转型和AI/ML产生的数据处理产业链中的知识产权法律法规及相关制度、条例和规范的入门读物。本文将阐述相关法律法规及条例对知识产权保护的要求,并给出实践中重要的基础知识,希望能够帮助读者快速了解知识产权保护、数据管理、数据处理、AI/ML模型开发等领域的法律法规要求。

2. 知识产权保护的基本概念和相关定义

2.1 知识产权

知识产权(Intellectual Property)是指具有创造性地目的是提供经济价值的某些信息或服务所属权,包括商标、版权、名誉、专利、商业秘密、数据库及其他所有形式的专属权利、尤其是权利人的知识产权或者他人拥有的财产权等。

2.2 知识产权的分类

知识产权一般分为两大类:

  1. 普遍原创权:指作者独创不引经费,创作后享有该创作物的所有权;如版权法第四条第一款规定的著作权,台湾地区的著作权法则第二十七条第一款规定的剧本权,日本国内图书基本保护的权利。

  2. 受制于作品外形或技术结构的专属权:专利权、商标权、商业秘密权、专用权、版权、域名注册权等。

知识产权类型 特点 应用对象 权限范围
普遍创新权 独创不引经费 专利权、商标权、商业秘密权、专用权 创作物全文所有权
专属权 受制于作品外形或技术结构 专利权、商标权、商业秘密权、专用权 作品外形或技术结构中的专属功能或部分
专属权 受制于专业团体的创意 专利权、商标权 特定技术、方法、产品的权力
受限权 依据外观设计、功能或性能等限制 专利权、商标权、商业秘密权、专用权 外观设计、功能或性能上的限制

2.3 知识产权保护的目的

知识产权保护是指保障知识产权的合法权益,防止侵害他人合法权利的行为,是国家为了保障公民享有权利而制定的一系列行政法规、法律法规和规范。

知识产权保护的目标主要有以下几项:

  1. 创造性地开发出新的知识,促进创新创造;
  2. 保护知识产权,防止侵犯他人合法权益;
  3. 促进信息技术和经济的发展,推动社会的繁荣稳定;
  4. 维护社会的和谐稳定,防止权威的滥用。

2.4 知识产权法律法规体系

知识产权法律法规体系由以下几个方面组成:

  1. 宪法:宪法主要确立了立法主体、法律主体、法律的解释权、效力及其修改等基本框架。
  2. 刑法:刑法主要对犯罪行为进行刑事处罚,保护知识产权权利人。
  3. 劳动法:劳动法保护职工、学生等劳动者的合法权益,引导劳动者合理利用自己的劳动获得报酬,维护劳动者个人合法权益。
  4. 保护自然资源法:保护自然资源,尤其是环境资源,如水土保持工程、基础设施建设、农田承包、矿山开采等,防止非法侵占。
  5. 环境保护法:环境保护法明确环境污染的级别和标准,禁止排放、利用、生产环境污染物,维护自然环境的稳定平衡。
  6. 计算机信息系统法:计算机信息系统法是国务院为规范计算机信息系统管理的立法。
  7. 知识产权保护条例:主要涉及知识产权的保护和法律责任,如保护期限、许可使用、转让控制、维持登记、披露义务、异议提起等。
  8. 其他法律法规:主要包括互联网相关法律法规、医疗器械、版权法、地方性法规、信托法等。

3. AI/ML产生的数据处理产业链中的知识产权法律法规及相关制度、条例和规范

3.1 知识产权保护的重要性

AI/ML产生的数据处理产业链对知识产权的保护尤为重要。人工智能、机器学习的出现将传统行业向前迈进了一大步,生产、消费、传输、存储数据的大数据流量、计算能力正在逐渐增长。在此背景下,越来越多的企业和组织开始把数据处理作为核心环节,而数据也日益成为知识产权的重要构成部分。

随着数据的复杂性和多样性的增长,处理数据过程中的信息产业巨头——云计算厂商和交易平台都开始探索数据知识产权保护的策略。尽管中国政府的相关法律法规已经相当完善,但由于不同国家对于数据处理过程中的知识产权保护措施的不同,因此仍存在很多问题需要解决。

3.2 知识产权法律法规的分类

根据知识产权的性质和作用,分为以下三类法律法规:

  1. 反映创造性作品的权利的权利法:包括著作权法、商标法、专利法等。
  2. 限制转让、使用、创作共用、摘编等权利的保护性法:包括版权法、商标法、专利法等。
  3. 保护个人私人数据的隐私权利的公民个人信息保护法。

3.3 知识产权法律法规对AI/ML数据处理产业链的影响

3.3.1 AI模型的知识产权保护

目前,AI模型的知识产权保护尚无统一规定。根据美国Fairness Accountability and Transparency Council (FATC) 的研究表明,模型开发者没有义务保护其知识产权,模型被部署到各种各样的应用程序和场景中之后,才可能被商业应用。但是,根据FATC的建议,模型的开发者应当遵守一些原则,例如限制使用其模型的商业用途,并做好监督、评估和改进工作。模型的创新性、可复制性、再创造性可能会带来新的法律问题,因此,模型开发者应当加强知识产权保护意识和法律知识。

近年来,一些公司发布了开源模型,这些模型可以帮助研究人员更好地理解算法背后的逻辑。同时,也有研究人员提出了一个问题:如何保证模型的开源可审查性?

3.3.2 数据集的知识产权保护

数据集的知识产权保护也是值得注意的问题。除了上述国家对于知识产权保护的法律法规之外,数据集的知识产权保护也需要加以保护。根据Berkeley Explainable AI Lab的报告显示,根据数据集的特性、属性和使用方式,确定数据集的版权和使用授权的方式也至关重要。

目前,最具代表性的案例之一就是Pinterest的PhotoDNA数据集。从Pinterest的网站上下载的数据集可以看出,数据集包含用户上传到该网站的图像和相应描述文本。但是,用户需要清楚地知道,Pinterest已将该数据集转给了一家名叫Neuroadaptive Inc.的第三方机构,而这个机构则有可能拥有该数据集的知识产权。因此,当数据集中包含用户自己上传的照片和数据时,应该小心翼翼地进行管理。

此外,数据集的可重复性很重要。如果能够证明数据集的原作者存在恶意,那么它就很难再用于研究和训练模型。因此,数据集的知识产权保护也要考虑如何保护数据集免受诸如滥用和侵权等风险。

3.3.3 数据分析结果的知识产权保护

数据分析结果的知识产权保护也是一项重要课题。人们习惯于认为数据分析结果属于知识产权,但其实并不是这样。由于数据分析结果本身的特殊性,其知识产权可能难以界定,因此,人们往往将数据分析结果视同其他专有权利甚至侵犯他人权利。

根据美国法律实验室Bellingcat的调研,超过80%的人认为数据分析结果属于公司的商业利益,因此,数据分析结果的知识产权保护与企业合作伙伴之间可能存在冲突。另外,如果数据分析结果与公众利益高度相关,那么知识产权保护也会成为诸多挑战。

此外,数据分析结果的可重复性也是一个重要因素。如果一个研究人员的研究结果能够被其他人复现出来,那么他就很容易受到怀疑,他的研究成果的可靠性就会受到质疑。因此,数据分析结果的知识产权保护也必须考虑如何保护数据分析结果免受诸如侵权、滥用等风险。

4. 基本知识和关键技术

4.1 数据集市场

数据集市是一个很重要的关键词。根据国际数据集市维基百科,数据集市是指供收集、整理、分析、共享数据资料的市场,如Amazon、Google、Microsoft Azure等。通过数据集市,个人和机构可以获取大量有效数据资源,包括原始数据、模型训练数据、经过处理的模型输出数据、可视化数据、建模工具和分析工具等。

数据集市对于数据处理工作者来说,可以极大的方便他们的数据获取,而且提供了大量的建模工具和分析工具,帮助他们完成数据科学任务。通过数据集市,数据处理工作者可以搭建自己的实验环境,快速尝试新模型或算法,避免了在本地搭建繁琐的实验环境,降低了实验投入和成本。

4.2 数据处理

数据处理是指利用数据集合按照一定的规则、技术或流程,进行抽取、转换、过滤、汇总等操作后得到想要的结果的过程。比如,我们可以选择某个城市的数据,然后对其中部分特征进行分析,最后得到汇总的经济指标。数据处理一般涉及三个基本环节:数据获取、数据清洗、数据分析。

数据获取

数据获取一般是指从源头到达目的地的数据的过程,可能包括网络爬虫、数据采集、API接口等。数据获取过程中可能存在数据传输、存储等方面的问题,可能会带来安全风险和法律风险。为了保护数据处理过程中的数据隐私、安全等,需要进行合法的法律法规和道德规范。

数据清洗

数据清洗是指对获取到的数据进行过滤、归纳、过滤、重组等操作,得到有效且符合要求的结果。数据清洗过程中可能存在缺失值、异常值、重复值等方面的问题,需要进行有效的清理。

数据分析

数据分析是指运用统计学、数据挖掘、机器学习等手段,通过对数据进行探索和分析,得到结论并提出建议。数据分析过程中可能会使用到数据处理工具、库和算法,这也需要注意保护知识产权。

4.3 数据集市与数据处理的交叉连接

数据集市和数据处理之间的交叉连接关系越来越紧密,因为数据处理往往涉及到多个相关数据集,数据集市也是云计算服务提供商、交易平台等商业组织提供的数据基础。通过数据集市,数据处理工作者可以利用大量的数据资源来训练模型、进行分析。

在这个过程中,数据集市和数据处理之间存在一种交叉关系,这导致知识产权的保护、法律合规程度的担忧也随之增加。这使得数据处理者必须认真对待数据集市的知识产权保护,以避免数据侵权、破坏等风险。

4.4 知识产权保护方式

知识产权保护方式的分类,可以分为三种类型:

  1. 专利法规:专利法规主要针对专利权,保护专利权人享有专利权的完整产权。
  2. 版权法规:版权法规主要针对版权权利人享有专有权利的作品的版权。
  3. 商标法规:商标法规主要用于保护商标权。

专利法规包括了著作权法、商标法、专利法等法律。版权法规包括了COPYRIGHT法、版权法等法律。商标法规则包括了商标注册、使用等法律。

4.5 CC协议

CC协议(Creative Commons)是由美国创始人Roy E. Lundberg创建的开放式许可证协议。CC协议主要用于创作者创作的内容授权,旨在鼓励创作者分享和利用他人创作的作品,而无需对其产生任何直接的版权费用。

CC协议的条款包括:

  1. 共享:允许公众分享、演绎、混合、再利用原作品。
  2. 署名:允许公众对原作品署名。
  3. 相同方式共享:允许公众以相同的Creative Commons许可证发布相同的作品。
  4. 非营利组织可以使用:允许公众利用非营利组织进行分销。
  5. 没有版权担保:不提供任何版权担保。

除以上条款外,CC协议还包括许可证的扩展。扩展主要用于保护专有IP并允许创建新的许可证。例如,只允许下载作品的非盈利组织、仅允许个人使用、版权结束时间限制等。

5. 未来发展方向

随着AI/ML对社会生活的影响越来越大,数据的产生、收集、整理、分析和处理越来越成为社会发展的一个重要部门。对于数据处理产业链中产生的数据,知识产权保护也是非常重要的环节。未来的AI/ML数据处理产业链将会进入知识产权保护时代。知识产权保护的法律法规、制度和规范将越来越细致、严格,随着创客、机器学习、大数据处理的发展,越来越多的行业和组织开始加入数据处理的产业链,知识产权保护将成为其中必不可少的环节。

当前,有许多行业和组织开始推进知识产权保护工作,如:微软、苹果、亚马逊、Facebook、谷歌、雅虎、Yahoo等,他们都有自己的知识产权保护方案。并且,一些知名的开源项目,如TensorFlow、PyTorch、Keras等,也开始关注其开源软件的知识产权保护工作。

当然,知识产权保护还有很多不足之处。如法律法规细则不健全,导致保护力度欠缺,保护力度不够;公共领域的知识产权保护制度不完善,导致公共领域的知识产权无法得到有效保护;缺乏专业知识产权保护人才,导致知识产权保护业务陷入僵局。

未来的知识产权保护发展方向包括以下五个方面:

  1. 建立科学、透明、公正的知识产权保护制度:知识产权保护需要有科学的立法基础,即建立科学、透明、公正的知识产权保护制度。既包括法律法规,也包括组织和社会保障机制。
  2. 提升信息技术的知识产权保护能力:制定保护知识产权的法律法规,要充分关注信息技术对知识产权的影响,包括数据安全和隐私保护,以及知识产权的定价、监控和打击等问题。
  3. 健全知识产权保护政策制定制度和管理机制:制定并落实知识产权保护政策和管理机制,包括知识产权侵权责任法律纠纷解决程序、知识产权调查、扣押或销毁知识产权的机制,以及知识产权的知识产权监督、管理、奖惩机制等。
  4. 规范知识产权实践活动:制定并完善知识产权实践活动的规范,包括商标注册、商标使用、专利申请、知识产权追踪、非商业用途使用授权、版权侵权辩护等活动的规范。
  5. 加强知识产权的政策宣导和政策执行:知识产权保护政策要广泛宣导、传递、参与与倡导,与政策制定、执行、监督、评估等环节相衔接,为政府决策提供坚实的支持。

全部评论 (0)

还没有任何评论哟~