消息称 Meta 无视自家律师警告,使用盗版书籍训练 AI 模型
创始人
2025-07-08 20:40:30
0

12 月 13 日消息,据路透社报道,根据一起版权侵权诉讼的新文件显示,Meta Platforms 在明知使用数千本盗版书籍训练其 AI 模型存在法律风险的情况下,仍然一意孤行。

据IT之家了解,该诉讼由喜剧演员 Sarah Silverman、普利策奖得主 Michael Chabon 等著名作家于今年夏天联合发起,他们指控 Meta 未经许可使用其作品训练人工智能语言模型 Llama。本周一起,该案与另一起类似诉讼合并审理。

上个月,加州一位法官驳回了 Silverman 的部分诉讼,但表示将允许作者修改诉讼内容。新诉状中包含了 Meta 一名研究员在 Discord 聊天服务器上讨论获取数据集的聊天记录,这可能是 Meta 知晓使用书籍可能存在版权风险的重要证据。聊天记录中的对话显示,他们曾讨论过使用盗版书籍训练 AI 模型的法律风险。其中,一位 Meta 研究员 Tim Dettmers 提到,Meta 的法律部门律师曾表示,如果使用这些书籍训练 AI 模型,可能会存在法律问题。律师称,这些数据无法使用,如果使用了的话,模型也无法发布。

今年,多家科技公司都面临着内容创作者的类似指控,他们指责这些公司在构建生成式 AI 模型时侵犯了作品版权。

如果这些诉讼成功,可能会给生成式 AI 的发展带来不利影响,因为这可能会增加构建 AI 模型的成本,迫使 AI 公司向艺术家、作者和其他内容创作者支付使用其作品的费用。

与此同时,欧盟关于人工智能的新临时规则可能会迫使公司披露其用于训练模型的数据,这可能会使他们面临更大的法律风险。

Meta 于今年 2 月发布了其第一版 Llama 大型语言模型,并公布了用于训练的数据集列表,其中包括“ThePile”数据集的“Books3”部分。根据诉讼文件,该数据集的创建者曾表示,其中包含 196,640 本书籍。该公司没有披露其最新版模型 Llama 2 的训练数据,该模型于今年夏天面向商业用户开放。

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...
《非诚勿扰》红人闫凤娇被曝厕所... 【51CTO.com 综合消息360安全专家提醒说,“闫凤娇”、“非诚勿扰”已经被黑客盯上成为了“木...
2012年第四季度互联网状况报... [[71653]]  北京时间4月25日消息,据国外媒体报道,全球知名的云平台公司Akamai Te...