加拿大的创作者和出版商希望政府对未经授权且通常未报告的使用他们的内容来训练生成式人工智能系统的行为有所作为。
但人工智能公司坚持认为,使用这些材料来训练他们的系统并不违反版权,并表示限制其使用将阻碍加拿大人工智能的发展。
联邦政府正在就版权和人工智能问题进行磋商,考虑加拿大的版权法应如何应对像 OpenAI 的 ChatGPT 这样的生成式人工智能系统的出现。
生成式人工智能可以根据简单的提示创建文本、图像、视频和计算机代码,但要做到这一点,系统必须首先研究大量现有内容。
在向政府提交的意见书中,Access Copyright 认为,目前大多数甚至可能所有大型语言模型都在从未经授权使用和复制版权保护作品中获利。
根据代表作家、视觉艺术家和出版商的 Access Copyright 的说法,这是在一个黑盒子里进行的。
权利人知道这种情况正在发生,但由于他们与人工智能平台之间的信息不对称,他们无法确定是谁在利用谁的作品进行这种活动,也没有任何机制来阻止这种情况的发生。
代表加拿大主要唱片公司的加拿大音乐公司(Music Canada)表示,去年,一首模仿德雷克(Drake)和The Weeknd声音的人工智能生成的假歌曲充分说明了一件事:人工智能模型和系统已经在未经数据源或权利人授权的情况下,摄取了大量专有数据集。
加拿大作家协会要求政府首先履行基本的披露和报告义务。它说,开发者掌握着作品被挖掘和如何使用的所有信息,而创作者却没有这些信息。
一些组织已经与人工智能公司签署了许可协议。但加拿大作家协会表示,权利人在授权其内容时面临巨大障碍,因为他们不知道自己的哪些作品被哪些公司使用。
它要求加拿大澄清文本和数据挖掘受版权法管辖。
美国正在就人工智能生成系统使用受版权保护的材料提起多起诉讼,其中包括本周全球最大的唱片公司对两家人工智能音乐生成器公司提起的诉讼。
加拿大媒体制作人协会说,法律案例说明了缺乏透明度带来的问题,它引用了一个案例,在该案例中,人工智能公司认为,除非权利人能够说明用于培训的确切作品,否则他们不能继续进行侵权指控。
毫无疑问,权利人也将面临类似的证据问题,因为许多用于训练生成式人工智能系统的数据集据称在初始训练完成后就被销毁了。
该组织表示,这是一个需要立即关注的问题,并要求政府实施透明度要求。
但人工智能公司认为,权利人所要求的那种透明度并不现实。
微软告诉政府,大规模人工智能系统的训练涉及到大量数据,公司不应该对此进行记录或披露用于训练的内容。
它说,记录这些信息是不可行的,任何此类要求都会阻碍人工智能的发展。
该公司认为,分析作品、学习概念和事实并不侵犯版权。
谷歌表示,根据现行的版权法,人工智能培训已经获得了豁免,不过政府应该通过一项豁免条款来明确这一点。
谷歌表示,要求获得许可才能将内容用于训练目的,会暴露竞争敏感信息,并将有效阻碍大型语言模型和其他类型尖端人工智能的开发和使用。
它还表示,人工智能开发人员无法获得有关版权状况的准确信息。
加拿大人工智能公司 Cohere 表示,使用内容训练人工智能系统的原理与个人阅读书籍以获取更多信息的方式类似。
该公司表示,这一过程并不违反版权,并认为这一点需要在法律中予以明确。否则,加拿大成为世界领先的人工智能公司和生态系统所在地的雄心壮志可能会受到损害。
代表加拿大科技界的加拿大创新者理事会(Council of Canadian Innovators)表示,相对于大科技公司的竞争对手,披露要求将损害小公司的利益。它警告说,这将严重阻碍加拿大公司大幅扩展规模的潜力。