正文

第二章 王选的抉择(9)

方正之道 作者:王伟群


★★★

日本人也同样在苦苦徘徊。

“当时只有日本搞出了三代机,但并没有从根本上解决汉字信息的存储问题,只能提供宋体和黑体两种字体,仅能勉强应付日文中的少量汉字,质量也达不到印刷要求,无法投入实际使用。”

多少人曾希望像西文一样采用黑白段长度编码技术,解决汉字字模信息的存储问题,却一一铩羽而归。无奈之下,从20世纪70年代初开始,NEC、京都大学尝试使用字元组字的方式来解决这一难题。把汉字看成是由一个或多个字元组成的图形,每个字元都用折线轮廓来加以描述,并将其轮廓信息存储到系统中,字形还原时先从系统中调出字元轮廓信息,然后把它们拼成汉字。比如“新”字,可由“立”、“木”、“斤”三个字元经放大、缩小、拉长、压扁处理后拼成。这样,字形信息的压缩率虽然很大,但是拼出来的汉字实在惨不忍睹。

难,还是太难,汉字字形特殊,数量庞大,第一代照排机发明40年了,可汉字照排系统依然是一座高不可攀的险峰,漠然地横亘在科学家面前,面无表情地拒绝了一个又一个努力攀爬的人们。

但是,“这个项目的难度和它的价值,大大地吸引着我。”王选后来说。

在一系列路径被证伪之后,王选凭借着他的数学功底,凭借他通灵软硬二界的烨烨才华,终于找到了一条属于他自己的路。

王选注意到,“汉字虽然繁多,但是有规律可循,每个汉字都可以细分成横、竖、折等规则笔画和点、撇、捺等不规则笔画。对于规则笔画,可以用一系列参数精确表示;对于不规则笔画,可以用轮廓表示。”

“我们统计了一下,汉字中规则笔画的比例占了近一半。”王选说。

以轮廓加参数的描述方法,使汉字字型信息得以以1∶500的比例高倍压缩。


上一章目录下一章

Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.
鄂ICP备15019699号 鄂公网安备 42010302001612号