智能中医 ——基于人工智能的专题知识库构建研究前言前言自中医学产生两千余年来,累积了丰富的文本资源,涵盖中医古籍文献、中医现代研究文献,这些中医文本资源是中医学术价值和中国文化传承的主要载体。随着数字时代的来临,人工智能技术飞速发展,中医学知识的传承与传播呈现出全新的方式,从简单数字化,到深度挖掘、知识发现、专题知识服务,人们试图读懂并挖掘中医文本资源中蕴含的知识,将中医文化发扬光大。“以文献为中心”的文献检索和信息获取方式已不能满足需求,取而代之的是“以知识为中心”的结构化、网络化和智能化的知识服务。除面向文献研究领域外,还要更多地面向临床和科研需求,针对不同的专科、主题,从中医文献中迅速发掘出需要的知识。有鉴于此,我们基于文本理解构建专题知识,为科研和临床提供源于文献的中医原创思维与临床实践经验。在多年自然语言处理、知识挖掘、人工智能、大数据计算研究的基础上,我们提出了“资源数据化、数据工具化、工具专题化、专题自动化”的思想,利用自然语言处理技术和机器学习方法,对公认的中医药领域知识进行重构,对相关文献进行语义标注,并构建领域本体;在语义化的基础上,通过机器学习等方法,生成语义元数据;然后,在中医专题知识库自动构建平台的帮助下,实现中医文本资源语义化过程与语义元数据体系的构建能够同步进行,从而实现中医文本资源的语义化、知识化,终实现从中医文本资源获取、资源加工到专题知识服务全流程的自动构建过程。主要研究内容如下:(1)理论与模型构建。中医文本资源包含各种格式,尤其是古籍文本体例繁多,中医专题知识库的生成需要对中医文本构建知识解析与知识组织模型。知识解析包括内容解析与结构解析,通过分词、命名实体识别、概念标引、概念关系发现等手段,实现中医文本的结构化。在此基础上,采用网络表示学习算法、多样化排序模型筛选专题细分类、概念关系判定模型等,实现有序化、结构化的知识组织。(2)算法与关键技术研究。重点研究了算法的原理、代码结构、算法运行结果等,以及概念标引技术、篇章结构解析技术、关系提取方法等中医专题知识库构建需要的核心算法与技术。(3)应用场景实证研究。从中医科研、临床诊疗等方面出发,以中医经方靶点预测、皮肤病辅助诊疗、基于古籍文本的泛专题生成为例,进行应用场景实证研究,介绍其中的流程、步骤、细节和经验,对上述理论与技术方法进行验证,终构建了中医专题知识库自动构建平台。平台具有中医文本资源加工、本体与知识图谱构建、系统管理等功能,将古籍文献、现代研究文献进行知识解析与知识组织重构,构建中医药领域知识体系。本书得到了部人文社科一般项目“数字人文视域下中医古籍知识图谱的构建与应用研究”(项目编号:22YJAZH165)的支持,项目的研究目标是本着“古籍知识化、知识服务化、服务智能化”的理念,将中医古籍文本进行结构化、语义化、知识化加工,实现对中医古籍文本内容的深度理解,能够根据科研、临床、教学等的目标驱动,提供语义检索、专题生成等知识定制服务。围绕以上目标,课题组提出了“用户需求驱动,中医理论引领,文献专家主导,信息技术实现”的研究思路,对中医古籍文本进行内容与结构双重解析,构建概念模型,挖掘其中的显性结构与隐性结构,对中医学知识体系进行梳理与重构,实现中医古籍文本的知识解析和知识组织,为中医专题知识库的生成提供理论与方法指导。本书还得到山东中医药大学中医文献与文化研究院与中国科学技术信息研究所联合项目“中医古籍文本知识图谱构建与应用系统”及山东省“泰山学者攀登计划”团队经费的支持,项目开发并完善语义资源生成、领域本体自动构建、泛专题生成等关键技术。本书内容分为七章:第1章为绪论,简述中医专题知识库自动生成与应用的研究背景、思路及全书内容安排;第2章介绍中医专题知识库相关理论与模型基础;第3章涵盖了中医专题知识库涉及的主要算法与关键技术;第4章和第5章分别从学术研究和临床实践出发,以中医经方靶点自动预测和皮肤病辅助诊疗路径生成为例,探索了知识再利用场景;第6章详细介绍基于中医古籍的泛专题知识综合生成方法;第7章对专题知识库自动生成依托的平台系统进行介绍。在编写过程中,本书参阅了大量的图书和文献,特别是引用了部分图表、数据等,在此向有关作者表示诚挚的感谢。在研究过程中也得到王振国教授等诸多业界专家、领导、同事的帮助和支持,在此一并致谢。研究生张逐、张瑾、谢若昀、李冠霖在前期的数据处理与案例实现中做了大量的工作;研究生陈一风、李浣青、翟雨、刘枫、赵钰潇不同程度地参与系统测试及内容整理方面的工作,特别是陈一风同学,在书稿整理中发挥了较大的作用,在此一并表示感谢。同时,也向开发团队人员及出版校对人员表示感谢。本书涉及中医学、文献学、信息学、计算机科学等学科知识和技术,聚焦中医古籍文本资源的数字人文开发与应用并进行了跨学科研究,可以为中医文本资源的深度开发与应用提供理论参考与技术支持,为中医临床、科研、教学研究提供源于中医古籍的原创理论与经验。可供从事中医古籍文本理解、中医药数字人文、中医科研与临床诊疗等研究者参考使用。由于作者水平有限,书中若有错谬之处,恳请同行专家和读者批评指正,以便进一步修订完善,为中医文本解析、知识组织与专题知识构建贡献更大的力量。