微软亚洲研究院博士:往返于研究与开发之间
创始人
2024-03-22 01:40:31
0

在微软亚洲研究院,有很多研究成果成功转化为产品的例子,让我们在期待今年技术节盛会之前,看看研究院技术战略总监张益肇博士回忆他往返于研究与开发之间的故事:

在微软亚洲研究院成立八个月之际,我带着妻儿举家来到北京开始了我研究生涯中的一个转折;2003年,在研究院成立五周年之际,我来到了由研究院孵化出的微软亚洲工程院,在一个全新的环境从事以前在微软未曾涉猎过的产品开发类工作;2008年,在研究院将要迎来它十周年生日的当儿,我又重新回到了它的怀抱,继续享受在研究过程中的乐趣。

给盖茨作报告

在1999年7月加入微软亚洲研究院的时候,我的主要工作之一就是组建语音组的研究团队,2000年我们招募了初敏加入语音组,次年又招募了Frank  Seide加入,他们俩的加盟很快地就带动起了整个组在语音合成和语音搜索上的研究局面。TTS (Text to Speech, 简称TTS) 是语音组的重要项目之一,当时由初敏研究员主要负责,再加上彭煳,赵勇,赵晟,杨红云,王庆等年轻同事的全力投入,很快地作出一个中文语音合成系统。也正因为这个项目,让我经历了三年的“BillG Review”(向盖茨作报告)。

2001年,研究院第一年向盖茨汇报中文语音合成技术的成果,语音的自然度和流畅感与传统技术比起来要进步很多。盖茨听了汇报之后感觉一切都还不错,但是他摇摇头非常惋惜地说:“很可惜,我听不懂中文。”因此,盖茨对此无法給出针对性的意见,不过他仍建议我们是否可以把其他语言也做起来,2003年10月左右,浩大的Vista项目看中了我们研发的中英文语音合成引擎,并意欲转换进Vista中。那个时候正好微软亚洲工程院成立,于是语音合成项目成为了工程院成立时的最初七个项目之一。因此,那一年研究院和工程院组成的研发团队一起给盖茨集体做了一场项目汇报。当盖茨得知我们这个项目正筹划着做进微软新一代操作系统时,他急切地关心起开发流程的时间表,可见他对这个技术的早日面市是何等得期待!

随着TTS在Vista系统中的落地开花,Frank Soong博士带领着语音组为更加平滑的语音合成技术而努力着,同时一个稳定的TTS开发团队也在微软中国研发集团的成长并逐渐茁壮,当初只有四五人的项目团队如今已经发展成为二十多人,从事着除中英文之外的德文、西班牙文、法文、意大利文等其他二十几种语言的语音合成系统的开发,主要侧重于服务器上的语音交互方面的应用。让我们倍感欣慰的是,TTS技术无论是从最初的算法模型设计、原型系统建立,还是到后来的产品转化与现在更大规模的在服务器端的应用,语音合成技术的研究和开发,都是北京的研发团队自发完成的,这充分证明了中国研究团队的创造力和协作力。

盖茨说过,微软研究院的最大使命是使未来的计算机能够看、听、学,能用自然语言与人类进行交流。其实,这十年,我们都是围绕着这个愿景展开着研究,也取得了阶段性的成果,但是仍然还远未达到人工智能的程度,所以研究是一个长期的过程,需要有探索的心态,并不断拓展延伸的可能。TTS这个项目从初敏2000加入研究院开始到2006年底正式随着Vista发布,从最初的中文语音合成,接着到英文,再到后来的中英文双语合成,经历了一个较长时间的探索过程,而这种摸索和坚持都要投诸于长期的耐心。

工程的魅力

随着最后一次给盖茨做汇报的落幕,我的职业角色也从一个单纯的研究者向一名工程管理者转变,2003年底我经历了一次鲤鱼跳龙门似的跨越,微软亚洲工程院副院长的职务让我重新认识了另一种职业的魅力。

张亚勤曾经说过研究是一种气象开放、思维扩散的事业,而工程是一个不断去粗取精,直到发现非做不可的事情为止的过程。这是研究和工程所体现出来的两种不同的视野。研究和工程两者唇齿相依,研究要以实现工程转化为理想,而工程实践也离不开研究的指导,这就像中国的太极一样,虽然在工程需要有了一定的偏向,但是不能太规矩,以至于没有新的设想和新的创造进行自我完善。它们之间如何拿捏得好确实是一项很大的挑战。

无论是研究还是工程,制定明确的指标是激励自己的团队一个非常有效的方式。倘若在研究领域,我们可能用国际高水平论文的质量和数量、技术转换的多寡等重要方面去激励研究员们的学术创想,而在工程领域,我们则更多地通过参与新功能开发的数量以及对新产品发布的贡献等方面来衡量一个工程师的价值。

除了激励之外,如何在错误和失败中吸取教训也是研究和工程中都需要经常面对的一个问题,因为在这两者中,挫败是太寻常不过的家常便饭了。作为研究员或者工程师,我觉得树立长向的思维非常重要,这样能避免被一时的失败而打击。年轻时候的大起大落,从一段时间之后看来都是很小的变化,所以要用平常心对待,才能适应各种不可预知的挑战。

从我个人而言,“保持乐观的态度,做好悲观的准备”的心态,是我在工作过程中勉励并且安慰自己的一个非常实际的做法。凡事都要先给自己一个信心和动力,但是我们也要做好勇敢地面对可能出现的失败结局。

作者介绍:

张益肇,麻省理工学院计算机博士毕业。1999年7月加盟微软亚洲研究院任语音组主任研究员,从事自然语言理解方面的研究工作。之后在微软亚洲工程院任副院长,带领团队参与开发了Windows Mobile 和Windows Vista 的产品。2008年6月重新回到微软亚洲研究院任技术战略总监。他曾是 Nuance Communications 公司研究部的创始人之一,也是电信领域自然语言界面研究的先驱。在此之前,他还曾在麻省理工学院林肯实验室、东芝ULSI研究中心、美国通用电气研究院担任研究工作。他一直以“苟日新,日日新,又日新”来激励自己每天的生活。

原为链接:http://blog.sina.com.cn/s/blog_4caedc7a0100cht3.html

【编辑推荐】

  1. 盖茨自称善用每1分钱 李嘉诚30岁以后再理财
  2. 盖茨抛售200万股微软股票 套现3770万
  3. 盖茨出资1250万美元 赞助20个手机转账项目

相关内容

热门资讯

施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
《非诚勿扰》红人闫凤娇被曝厕所... 【51CTO.com 综合消息360安全专家提醒说,“闫凤娇”、“非诚勿扰”已经被黑客盯上成为了“木...
2012年第四季度互联网状况报... [[71653]]  北京时间4月25日消息,据国外媒体报道,全球知名的云平台公司Akamai Te...
VMware vFabric (2012年5月17日中国北京)——全球虚拟化和云基础架构厂商VMware公司(NYSE:VMW)今...
由浅入深学习CentOS入门 在系统的学习CentOS入门的知识中,我们掌握了一些基本的设置。今天我们来讲一下CentOS入门中的...
虚拟现实 人工智能和人体未来会... 探讨像虚拟现实和人工智能这样的技术将会跟人体发生怎样的融合。未来将会出现模糊虚拟现实和现实本身界限的...