计算机技术和互联网技术的迅速发展,使得网络上的网站、网页等各种信息以爆炸性的趋势增长,随之而来的还有大量的冗余信息和垃圾信息,并由此带来了信息泛滥、信息迷航以及信息疾病等一系列问题。这些冗余信息、垃圾信息不但影响着用户对Internet的使用效率和质量,同样影响着网络的健康发展。因此,基于此而产生的网络信息过滤技术相关研究具有巨大的社会效益和经济效益。 网络信息过滤,就是根据用户的信息需求,利用一定的工具从大规模的动态信息流中自动筛选出满足用户需求的信息,同时屏蔽掉无用的信息的过程。广义的信息过滤包括对文本、音频、图像、视频等多种信息存在形式的过滤处理,狭义的信息过滤是特指对文本信息的过滤处理。本书相关研究就是针对文本信息过滤特别是中文文本信息过滤中存在的问题而提出的。 本书面向从事自然处理、网络信息、网络舆情分析等领域研究的高年级本科生、研究生和研究人员。