杰克逊跳舞秒变3D机器人!阿里又出新活儿,视频任何人可替换
创始人
2025-07-11 08:11:40
0

这究竟是怎么回事?

原来啊,阿里又整出新活儿——

MotionShop,能将视频中的人物角色替换成3D形象,同时又不改变其他场景和人物。

比如,打工仔小猪打太极。

看到这有人已经迫不及待了。目前已在ModelScope社区开放试玩。

图片

还有人建议说在HuggingFace也安排一下,不然不懂中文的人怎么办啊~

图片

不过确实承认,最近阿里的花活好多。

图片

可免费试玩

目前MotionShop可以免费试玩,只需三步即可完成:

上传视频——确定目标对象——选择要替换的虚拟对象。

不过实测的时候发现,需要注意几点。

首先上传这个视频,不能超过15秒,最好保证人物完整,而且也不能是剪辑而成。

换句话说,需要一镜到底,切换镜头就不行。

随后选择替换人物时,它会自动选择一个对象,然后看是否符合你的目标对象。

目前可替换的虚拟形象只有四个。

图片

最后就是比较漫长的排队等待时间……试用的人太多了吧。

图片

如何实现?

来自阿里的研究团队提出了用3D人物替换视频中角色的框架。

整个框架由两部分组成:

1、用于提取修复背景视频序列的视频处理管线;

2、用于生成3D人物视频的序列的姿态估计和渲染管线。

通过并行两条管线并使用高性能的光线追踪渲染器TIDE,整个过程能在

图片

具体分为七个步骤。

第一步,角色检测。使用基于Transformer融合文本信息与现有封闭集检测器,实现零样本对象检测。通过优势选择方法确定最终目标区域。

第二步,分割与追踪。成功检测到目标后,通过视频对象分割跟踪方法来像素级跟踪目标区域,这一方法是基于SAM模型的细化升级。

第三步,修补。视频剩下区域进行修补绘制。包括采用了递归流完成法来恢复损坏的流场,在图像域和特征域都采用了双域传播法来增强全局和局部的时间一致性。

第四步,姿态估计。采用姿态估计方法 CVFFS 来估计稳定的人体姿态。使用 SMPL 人体模型来表示三维人体。

第五步,3D人物生成。将估算出的形状和姿势重新映射到选定的三维模型上。

第六步,为了更自然真实的视觉效果,做进一步光线处理和渲染,让3D模型与原视频更融入。比如使用TIDE引擎来渲染新的 3D 模型。它与精确的材质系统相结合,并辅以运动模糊、时间抗锯齿和时间去噪等算法。

最后,将渲染图像与原始视频合成,生成最终视频。

感兴趣的朋友可戳下方链接:

https://modelscope.cn/studios/Damo_XR_Lab/motionshop/summary

相关内容

热门资讯

PHP新手之PHP入门 PHP是一种易于学习和使用的服务器端脚本语言。只需要很少的编程知识你就能使用PHP建立一个真正交互的...
网络中立的未来 网络中立性是什... 《牛津词典》中对“网络中立”的解释是“电信运营商应秉持的一种原则,即不考虑来源地提供所有内容和应用的...
各种千兆交换机的数据接口类型详... 千兆交换机有很多值得学习的地方,这里我们主要介绍各种千兆交换机的数据接口类型,作为局域网的主要连接设...
什么是大数据安全 什么是大数据... 在《为什么需要大数据安全分析》一文中,我们已经阐述了一个重要观点,即:安全要素信息呈现出大数据的特征...
如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
P2P的自白|我不生产内容,我... 现在一提起P2P,人们就会联想到正在被有关部门“围剿”的互联网理财服务。×租宝事件使得劳...
Intel将Moblin社区控... 本周二,非营利机构Linux基金会宣布,他们将担负起Moblin社区的管理工作,而这之前,Mobli...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...