甲骨文是指我国古代用于占卜记事而在龟甲或兽骨上契刻的文字,是我国迄今发现的最早的一种成熟文字系统,在我国文字发展史上占有重要地位。随着计算机技术的发展,利用计算机技术对甲骨文信息处理已经成为甲骨文研究、考释和应用的一个新课题。随着计算机信息技术的发展,古文字的数字化研究、印刷和出版等领域对甲骨文字形的需求越来越高,如何能让计算机像处理现代文字一样处理甲骨文字,成为计算机学者和文字与语言学者共同关注的课题。但是,多年来,在甲骨文数字化过程中,一直存在3个难以解决的问题:一是甲骨字难以定形,甲骨字字形复杂,存在较多的异体字和合体字,甲骨字不像现代汉字,很难确定每一个甲骨字的字形结构和类型;二是甲骨字难以定量,大量的未释字和新出土的甲骨字难以表示;三是甲骨字难以输入计算机。为此,许多学者试图通过研究和设计字形库来解决计算机中甲骨文字形的显示和打印问题,通过设计各种各样的输入编码方案来解决甲骨文的输入问题。多年来的实践证明,对于规范的现代汉字,可以使用这样的办法去解决,但对于甲骨文字,这一方法并不完全适用。首先,甲骨文字形复杂,存在较多的异体字和合体字,并且还有近2/3的字没有完全考释出来。其次,甲骨文字形的规范性不像现代汉字一样有一个统一的标准,从近几年出现的不同甲骨文字形库来看,许多学者在甲骨文字形的认同方面存在很大的差距。香港中文大学的沈建华和曹锦炎确定了6000多个甲骨文字形(包括异体字) ,给甲骨文研究带来了极大的方便。但是,由于过度“规范化”,其中很多字形已经脱离了原始字形所表达的意义,有的还存在部件结构和位置的错误。在古文字数字化新环境中,以字库形式建立起来的甲骨文检索系统虽然适合文本形式检索,但是原有缺陷被放大,并且显现出若干新的问题。