谷歌AI新星转投Pika:视频生成Lumiere一作,担任创始科学家
创始人
2025-07-13 03:41:22
0

视频生成进展如火如荼,Pika迎来一位大将——

谷歌研究员Omer Bar-Tal,担任Pika创始科学家

一个月前,还在谷歌以共同一作的身份发布视频生成模型Lumiere,效果十分惊艳。

图片

当时网友表示:谷歌加入视频生成战局,又有好戏可看了。

图片

Stability AI CEO、谷歌前同事等在内一些业内人士送上了祝福。

图片
图片

Lumiere一作,刚硕士毕业

Omer Bar-Tal,2021年本科毕业于特拉维夫大学的数学与计算机系,随后前往魏茨曼科学研究所攻读计算机硕士,主要聚焦于图像和视频合成领域的研究。

其论文成果多次被顶会接收,比如Text2LIVE(ECCV 2022 Oral)、MultiDiffusion(ICML 2023)、TokenFlow(ICLR 2024)。

以TokenFlow为例,他们提出了一种框架,基于扩散模型实现文本驱动的视频编辑,支持视频编辑任务无需任何训练或微调。

图片

此次加盟Pika前,他曾是谷歌研究院以Student Researcher身份待了9个月,最终经过7个月的研究以共同一作身份推出了Lumiere。这时候硕士应该还没有毕业。

图片

Lumiere的创新点在于,提出了时空U-Net(STU-Net)架构:将视频在空间和时间两个维度同时进行下采样和上采样,在网络的中间层得到视频的压缩时空表示。

在学习了3000万视频之后,Lumiere可支持文生视频、视频编辑修复、图片转视频以及视频风格化等多种功能。

当时Jeff Dean盛赞:多模态视频生成革命正在发生

图片

威尔史密斯吃面(Pika版)

官宣加盟Pika消息之后,官方以及投资人等也送上了祝福。

图片

前几天,还有位Pika华人研究员Yilun Du发布了篇文章, 不过应该刚从MIT博士毕业(也可能还没毕业),论文单位仍是MIT。

图片

另外在官网还在继续招人中。

图片


相关内容

热门资讯

PHP新手之PHP入门 PHP是一种易于学习和使用的服务器端脚本语言。只需要很少的编程知识你就能使用PHP建立一个真正交互的...
网络中立的未来 网络中立性是什... 《牛津词典》中对“网络中立”的解释是“电信运营商应秉持的一种原则,即不考虑来源地提供所有内容和应用的...
各种千兆交换机的数据接口类型详... 千兆交换机有很多值得学习的地方,这里我们主要介绍各种千兆交换机的数据接口类型,作为局域网的主要连接设...
什么是大数据安全 什么是大数据... 在《为什么需要大数据安全分析》一文中,我们已经阐述了一个重要观点,即:安全要素信息呈现出大数据的特征...
如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
P2P的自白|我不生产内容,我... 现在一提起P2P,人们就会联想到正在被有关部门“围剿”的互联网理财服务。×租宝事件使得劳...
Intel将Moblin社区控... 本周二,非营利机构Linux基金会宣布,他们将担负起Moblin社区的管理工作,而这之前,Mobli...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...