legal work committee

法务工作委员会
 热门关键词:娱乐法   法商论坛    法务委员查询 
中国电视剧制作产业协会
联系我们
职业培训
Convenience services
  
  
张平:生成式人工智能数据训练知识产权合法性问题探讨
来源: | 作者:张平 | 发布时间: 2023-09-05 | 3447 次浏览 | 分享到:

我国目前的生成式人工智能技术创新还处在初级阶段,法律法规的制定应当给科技创新留有一定的发展空间,对于产品在研发阶段的数据合法性要求,应当根据数据类型和基本伦理要求,采取开放包容的规范原则。
国家互联网信息办公室近日发布的《生成式人工智能服务管理暂行办法》(下称《办法》)第七条规定:“生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,使用具有合法来源的数据和基础模型;不得侵害他人依法享有的知识产权;涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;……”该条款的主要目的是规范生成式人工智能服务提供者数据来源的合法性问题,这也是当前全球范围内生成式人工智能数据合法性的焦点问题。
数据来源合法性是生成式人工智能产品合规的必要条件,若数据来源不合法不合规,该产品将无法进入市场应用阶段。在目前我国已经实施《网络安全法》《数据安全法》《个人信息保护法》的背景下,生成式人工智能产品的训练数据以及后续的商业应用,必须符合这些法律中对个人信息、数据安全和知识产权的合法性要求。但是,如果在生成式人工智能研发阶段就严格执行合法性标准,就会限制大数据的广泛采集,阻碍研发进程,影响高品质、高智能产品的诞生。所以,《办法》第三条也提出了“坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管”的基本原则。我国目前的生成式人工智能技术创新还处在初级阶段,还没有形成有竞争力的产品,法律法规的制定应当给科技创新留有一定的发展空间,对于生成式人工智能产品在研发阶段的数据合法性要求,应当根据数据类型和基本伦理要求,采取开放包容的规范原则。
从目前世界上的各种智能生成产品来看,美国的ChatGPT已经领先并将成为生成式人工智能产品的“基础设施”,国内许多领域的衍生产品都是基于这一“基础设施”展开研发的。我国要在这一领域有所突破创新,一定要有相对宽松的法律政策环境和技术生态建设,吸取传统信息产业领域软件和芯片技术“受制于人”窘境的教训,利用我国独有的数据红利以及政策环境,快速形成自主可控的生成式人工智能基础技术体系。

生成式人工智能数据训练的需求及知识产权风险


生成式人工智能数据训练的需求体现在数据数量、多样性、质量、领域特定性、多模态性、实时性、长期演进性、平衡性、合规性以及多语言性等方面。满足这些需求,可以帮助生成式AI模型更好地适应各种场景和任务,提高其性能和可应用性。

 
组织人员
The organizer
领导班子
秘书处
专家委员
法务委员