纽约时报起诉微软和OpenAI侵权:擅用报道训练大模型 损失数十亿美元

【澎湃新闻】《纽约时报》指控微软和OpenAI侵犯版权,违规使用其文章训练ChatGPT等AI(人工智能)聊天机器人。

当地时间12月27日,《纽约时报》以侵犯版权为由起诉OpenAI和微软,成为了第一家起诉这两家公司侵犯其文字作品版权的美国大型媒体。《纽约时报》称其发布的数百万篇文章被用于训练两家公司旗下的自动聊天机器人,这些机器人现在被视为可靠的信息来源,与《纽约时报》等新闻机构展开了直接竞争。

《纽约时报》已经聘请律师事务所Susman Godfrey作为其在这场诉讼中的首席外部法律顾问。该诉讼未提出具体的赔偿金额要求,但《纽约时报》指出,被告应为“非法复制和使用《纽约时报》独特且有价值的作品”和与之相关的“价值数十亿美元的法定和实际损失”负责。

此外,《纽约时报》要求两家公司销毁任何使用到《纽约时报》版权材料的聊天机器人模型和训练数据。微软和OpenAI尚未对此事作出回应。

这场诉讼可能会考验生成式AI技术的新兴法律框架。《纽约时报》在诉讼中指出,OpenAI和微软“试图在《纽约时报》已经在新闻业进行巨额投资的基础上搭便车”,称它们“未经付费使用《纽约时报》的内容,创造了《纽约时报》的替代品并利用其把受众吸引走”。

《纽约时报》还表示,其已于今年四月与微软和OpenAI进行接触,对两家公司使用其受知识产权保护的内容表示了担忧,并探讨了“一种友好解决方案”的可能性,其中可能包括一项商业协议以及围绕生成式AI产品的“技术限制”。但是,谈判并没有得出解决方案。

除了寻求知识产权保护外,《纽约时报》的诉讼将ChatGPT和其他AI系统描绘为新闻业潜在的竞争对手。当聊天机器人被问及时事新闻或其他相关话题时,它们可以利用《纽约时报》过去的新闻报道来生成回答。《纽约时报》认为,一些读者会对聊天机器人的回答感到满意,不再访问《纽约时报》网站,从而减少能够转化为广告和订阅收入的网站流量。

《纽约时报》在诉讼中引用了几个案例,其中显示聊天机器人向用户提供的内容与《纽约时报》的文章几乎一字不差,而这些文章在《纽约时报》网站上需要付费订阅才能阅读。《纽约时报》表示,OpenAI和微软特别强调这些AI在训练时使用了《纽约时报》的新闻报道,因为他们认为这些材料具有可靠性和准确性。

《纽约时报》还警告称,AI的“幻觉”问题可能对媒体的品牌声誉造成潜在伤害,因为聊天机器人会在回答中插入虚假信息并错误地将其归因于某一信息源。诉状对此也引用了几个案例,其中,微软的Bing Chat提供了据称是来自《纽约时报》的错误信息。例如,Bing Chat会提供“15种最有益于心脏健康的食物”的搜索结果,而其中有12种食物在《纽约时报》的对应文章中并未提及。

在过去的一年里,生成式AI继续繁荣发展,媒体机构一直在研究这种繁荣会给他们的法律、财务和新闻带来怎样的影响。一些新闻机构已经达成了让ChatGPT使用其新闻报道的协议,例如,美联社在七月与OpenAI达成了一项许可协议,而德国媒体巨头Axel Springer也在本月也和OpenAI达成了类似协议,建立全球合作伙伴关系。这些协议的具体条款并未公开。

《纽约时报》在诉讼中写道:“如果《纽约时报》和其他新闻机构无法制作和保护独立的新闻报道,将会造成一个计算机和AI无法填补的真空。这将会减少新闻报道的生产,让社会付出巨大的代价。”