正文

第90节:“掌上”视频拉近你我的距离(2)

揭秘微软亚洲研究院:微软的梦工场 作者:微软亚洲研究院


“二值视频”技术大大降低了视频的原始数据量,而且传输中的连贯性较好,可是其间产生的噪声还是比较多。后来我们又想了一个更为巧妙的办法,这也是“微软肖像”中的核心技术:在区分黑白的时候,不是设定一个单一的阈值来比较,而是设定一个阈值带来比较。阈值带有一定的宽度范围。如果图像像素的灰度值在这个阈值带的上限以上,我们能够很明确地说它是1;如果在它的下限以下,我们也可以很明确地说它是0。但是如果图像像素的灰度值处于这个阈值带之内怎么办呢?我们的处理办法是根据它同一帧内周围的像素和它前一帧相应点周围像素的情况来确定。简单地讲,比如前一帧该点位置是黑的,这一帧该点位置也就是黑的。这样两帧播放起来就连贯了。根据这个原理当时,还是实习生,现在已经是副研究员的许继征给出了相应的算术编码解法。

填补学术界空白

总的来说,我们组投入了较大的精力于“二值视频”技术的摸索和创新,也通过一系列的开创性研究填补了学术界的空白,而且始终居于世界领先地位。同时,我们还创立了一种新型的视频形态——“二值视频”。

大家知道,国际上静态的彩色图像有JPEG图像,动态的彩色视频有MPEG视频,静态的黑白二值图像有JBIG图像,而我们创立的可称为动态的黑白“二值视频”。后来,在“二值视频”的基础上,我们又进一步推出了“四值视频”与此同时,随着带宽条件的不断改善,我们也试着用“第二条腿”走路——在确定了黑白版的微软肖像视频的基础上,我们组又开始向“彩色版”挺进。

从黑白版的“二值视频”到“四值视频”,再到彩色视频,随着对传输速度和带宽要求的递增,“微软肖像”为用户提供了可以满足不同网络条件而可供选择的软件类型。这三种技术从视频的效果来看,应该说已经包含了所有的功能。近一两年中,我们所做的工作主要是为增强这个可视通信软件的一些其他辅助功能,比如能够更多地支持不同类型的摄像头,能够增强连接性,或者拍张照片,可以传送文件等。

“微软肖像”软件是很多人团结协作的成果。当时是软件工程师,现在是开发主管的陈刚,编译出了第一个可运行的软件版本。其后又有余可曼、唐健、和林庆维接手这个软件的制作。很多访问学生如周涵宁、王勇、王凯波、王利杰、贺铁林、林云峰、吕江波等都对算法等各方面的研究做出了贡献。当时的研究主管沈向洋博士、李世鹏博士、张亚勤博士等对这个项目给予了大力支持。

虽然目前“微软肖像”还没有被正式运用到微软的产品中,但是这项技术却通过各种各样讨论掌上电脑和手机的社区网站不断被世人认识,并通过资源共享真正让用户体验到其中的交互乐趣。2001年,“微软肖像”技术在国际多媒体大会上向国际学术界宣布它的诞生。同年8月8日,当USA Today(《今日美国》)的记者第一次通过媒体的声音公开向全世界读者介绍“微软肖像”的时候,我们从来没有想象过这项技术会受到如此的青睐和好评。后来随着包括《麻省理工学院技术评论》等重量级媒体对这项技术的报道和千千万万热心用户对我们软件的反馈之后,我们坚信了”做真正满足用户需要的产品才是创新研究的根本”这一信条。我想这也是我们从事计算机基础的研究工作者应该谨记的信条。

作者介绍:

李江,1999年1月加入微软亚洲研究院任研究员,2004年任多媒体通信组主任研究员。之前他曾任浙江大学物理系副教授。他于1989年获清华大学物理系学士学位,1992年获浙江大学物理系光学硕士学位,1988年获浙江大学数学系应用数学博士学位。他做研究项目看重对人的意义和潜在的商业模式,做事讲究简单有条理,平时爱看书、看电影及外出旅游。


上一章目录下一章

Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.
鄂ICP备15019699号 鄂公网安备 42010302001612号