消息称 Meta 无视自家律师警告,使用盗版书籍训练 AI 模型
创始人
2025-07-08 20:40:30
0

12 月 13 日消息,据路透社报道,根据一起版权侵权诉讼的新文件显示,Meta Platforms 在明知使用数千本盗版书籍训练其 AI 模型存在法律风险的情况下,仍然一意孤行。

据IT之家了解,该诉讼由喜剧演员 Sarah Silverman、普利策奖得主 Michael Chabon 等著名作家于今年夏天联合发起,他们指控 Meta 未经许可使用其作品训练人工智能语言模型 Llama。本周一起,该案与另一起类似诉讼合并审理。

上个月,加州一位法官驳回了 Silverman 的部分诉讼,但表示将允许作者修改诉讼内容。新诉状中包含了 Meta 一名研究员在 Discord 聊天服务器上讨论获取数据集的聊天记录,这可能是 Meta 知晓使用书籍可能存在版权风险的重要证据。聊天记录中的对话显示,他们曾讨论过使用盗版书籍训练 AI 模型的法律风险。其中,一位 Meta 研究员 Tim Dettmers 提到,Meta 的法律部门律师曾表示,如果使用这些书籍训练 AI 模型,可能会存在法律问题。律师称,这些数据无法使用,如果使用了的话,模型也无法发布。

今年,多家科技公司都面临着内容创作者的类似指控,他们指责这些公司在构建生成式 AI 模型时侵犯了作品版权。

如果这些诉讼成功,可能会给生成式 AI 的发展带来不利影响,因为这可能会增加构建 AI 模型的成本,迫使 AI 公司向艺术家、作者和其他内容创作者支付使用其作品的费用。

与此同时,欧盟关于人工智能的新临时规则可能会迫使公司披露其用于训练模型的数据,这可能会使他们面临更大的法律风险。

Meta 于今年 2 月发布了其第一版 Llama 大型语言模型,并公布了用于训练的数据集列表,其中包括“ThePile”数据集的“Books3”部分。根据诉讼文件,该数据集的创建者曾表示,其中包含 196,640 本书籍。该公司没有披露其最新版模型 Llama 2 的训练数据,该模型于今年夏天面向商业用户开放。

相关内容

热门资讯

PHP新手之PHP入门 PHP是一种易于学习和使用的服务器端脚本语言。只需要很少的编程知识你就能使用PHP建立一个真正交互的...
网络中立的未来 网络中立性是什... 《牛津词典》中对“网络中立”的解释是“电信运营商应秉持的一种原则,即不考虑来源地提供所有内容和应用的...
各种千兆交换机的数据接口类型详... 千兆交换机有很多值得学习的地方,这里我们主要介绍各种千兆交换机的数据接口类型,作为局域网的主要连接设...
全面诠释网络负载均衡 负载均衡的出现大大缓解了服务器的压力,更是有效的利用了资源,提高了效率。那么我们现在来说一下网络负载...
什么是大数据安全 什么是大数据... 在《为什么需要大数据安全分析》一文中,我们已经阐述了一个重要观点,即:安全要素信息呈现出大数据的特征...
如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
P2P的自白|我不生产内容,我... 现在一提起P2P,人们就会联想到正在被有关部门“围剿”的互联网理财服务。×租宝事件使得劳...
Intel将Moblin社区控... 本周二,非营利机构Linux基金会宣布,他们将担负起Moblin社区的管理工作,而这之前,Mobli...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...