新闻行业在对抗 OpenAI 的过程中刚刚获得了一个强大的盟友。
继《纽约时报》、《芝加哥论坛报》和《纽约每日新闻》等出版机构提起类似诉讼后,美国历史最悠久的非营利性新闻机构调查报道中心(Center for Investigative Reporting)周四在联邦法院起诉OpenAI和主要支持者微软涉嫌侵犯版权。
CIR 在向纽约南区法院提起的诉讼中声称,OpenAI 在未经 CIR 许可或授权的情况下复制、使用、删节和展示了 CIR 的有价值内容,且未向 CIR 支付任何补偿。
自 2022 年底公开发布以来,OpenAI 的 ChatGPT 聊天机器人一直在网络上爬行,为用户的询问提供答案,通常主要依靠直接从新闻报道中提取的内容。
原告在诉讼中写道,当被告在其培训集中加入新闻作品时,他们可以做出选择:是尊重新闻作品,还是不尊重新闻作品。被告选择了后者。
在周四的一份新闻稿中,非营利组织首席执行官莫妮卡-鲍尔莱因(Monika Bauerlein)指责被告有搭便车的行为。
Bauerlein说,OpenAI和微软开始吸纳我们的故事,使他们的产品更加强大,但他们从未征求过我们的同意,也没有提供过补偿,这与其他授权使用我们材料的组织不同。
作为《琼斯母亲》和音频节目《露天》的所在地,CIR 还在诉讼中声称,OpenAI 训练 ChatGPT 不承认或不尊重版权。而他们这样做都是未经许可的。
该组织表示,它正在寻求实际损害赔偿和被告的利润,或每件侵权作品不少于 750 美元的法定损害赔偿,以及每次违反 DMCA(指《数字千年版权法》)不少于 2500 美元的法定损害赔偿。
OpenAI 发言人说,我们正在与新闻行业合作,并与全球新闻出版商合作,在我们的产品(如 ChatGPT)中显示他们的内容,包括摘要、引文和归属,以推动流量回到原始文章。合作关系的一个组成部分是利用各种机器学习和训练技术利用出版商内容的能力,以帮助我们优化这些内容的显示,使其对用户更有用。
随着人工智能生成的内容越来越普遍,许多出版物都在积极努力保护自己的业务。
12 月,《纽约时报》对微软和 OpenAI 提起诉讼,指控其在 ChatGPT 培训数据中出现的新闻内容侵犯了《纽约时报》的知识产权。纽约时报》在向美国纽约南区地方法院提交的一份文件中称,该公司要求微软和 OpenAI 承担数十亿美元的法定赔偿和实际赔偿,这些赔偿与非法复制和使用《纽约时报》具有独特价值的作品有关。OpenAI 不同意《纽约时报》对事件的描述。
芝加哥论坛报》和其他七家报纸也于 4 月提起了类似诉讼。
新闻之外,包括乔纳森-弗兰岑(Jonathan Franzen)、约翰-格里沙姆(John Grisham)、乔治-马丁(George R.R. Martin)和乔迪-皮考特(Jodi Picoult)在内的一批美国著名作家去年起诉 OpenAI,指控 OpenAI 使用他们的作品训练 ChatGPT 侵犯了版权。
但并不是所有的新闻机构都做好了战斗准备,有些机构反而与 OpenAI 展开了合作。本周四早些时候,OpenAI 和《时代》杂志宣布了一项多年期内容协议,允许 OpenAI 访问《时代》杂志 100 多年历史上的最新文章和存档文章。
据一份新闻稿称,OpenAI 将能够在其 ChatGPT 聊天机器人中显示 Time 的内容,以回答用户的问题,并使用 Time 的内容来增强其产品,或者很可能用来训练其人工智能模型。
OpenAI 在 5 月份宣布与新闻集团建立类似的合作伙伴关系,允许 OpenAI 访问《华尔街日报》、《市场观察》、《巴伦周刊》、《纽约邮报》和其他出版物的当前和存档文章。Reddit 也在 5 月份宣布将与 OpenAI 合作,允许该公司在 Reddit 内容上训练其人工智能模型。