OpenAI DALL-E 3 模型存生成“不当内容”漏洞,一微软员工上报后反遭“封口令”
创始人
2025-07-12 10:00:50
0

2 月 2 日消息,微软软件工程部门经理 Shane Jones 日前发现 OpenAI 旗下 DALL-E 3 模型存在漏洞,据称能够生成一系列 NSFW 不当内容,在上报相关漏洞后,Shane Jones 却被下达“封口令”,不过该员工最终还是选择向外界披露相关漏洞。

▲ 图源 Shane Jones 对外披露的报告

IT之家注意到,Shane Jones 在去年 12 月通过独立研究发现 OpenAI 文字生成图片的 DALL-E 3 模型存在一项漏洞,能绕过 AI 护栏(AI Guardrail)生成一系列 NSFW 不当内容。

之后 Shane Jones 将漏洞曝光上报微软及 OpenAI,并在领英上发布公开信,声称相关漏洞会对大众造成安全风险,呼吁 OpenAI 在解决漏洞前应暂时下架 DALL-E 3 模型。

随后 Shane Jones 被微软法务部及高管找上门,并警告他立即删除领英公开信并停止对外披露任何内容,但却并未给予任何解释说明,此后 Shane Jones 屡次寻求公司内部沟通,但均未得到公司回应,而漏洞也未修复,之后 Shane Jones 便向媒体及有关部门披露了相关漏洞。

Shane Jones 提到,近日网络上出现 AI 生成的知名歌手 Taylor Swift(泰勒・斯威夫特)不雅照便与该漏洞有一定关联,这些不雅照据称是使用微软 Designer AI 功能生成,而 Designer 底层模型正是 DALL-E 3,因此微软在本次事件中下达“封口令”存在重大过失。

此后微软官方回应 Engadget 等媒体,声称将解决相关员工的疑虑,并修复相关漏洞,不过微软同时声称 Shane Jones 披露的漏洞实际上成功率较低,“无法绕过微软为模型设置的所有安全机制”、“目前还不清楚该漏洞与 Taylor Swift 不雅照事件是否有关联性”。

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
各种千兆交换机的数据接口类型详... 千兆交换机有很多值得学习的地方,这里我们主要介绍各种千兆交换机的数据接口类型,作为局域网的主要连接设...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...
范例解读VB.NET获取环境变... VB.NET编程语言的使用范围非常广泛,可以帮助开发人员处理各种程序中的需求,而且还能对移动设备进行...
规避非法攻击 用好路由器远程管... 单位在市区不同位置设立了科技服务点,每一个服务点的员工都通过宽带路由器进行共享上网,和单位网络保持联...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...