十年磨一剑。中国社科院近代史研究所云妍副研究员与香港大学经济与工商管理学院陈志武教授、中国人民大学历史学系林展博士合作的《官绅的荷包——清代精英家庭资产结构研究》(后文简称《官绅的荷包》)一书,历时十年,在2019年岁末由中信出版社出版了。就选题而言,官绅群体家庭资产的系统研究在清史中尚不多见,该书为理解清代社会的阶层分化和中上层经济生活提供了新看法。同时,对一些家喻户晓的“名官大贪”,如年羹尧、和绅等真实家资规模的再讨论本身也充满了话题性。就方法而论,该书以构建官绅资产数据库为基础,以量化研究为主要手段。量化历史数据库的构建与研究,是当前学界前沿性的新方法。
量化历史研究的优势在于整合大规模系统史料,提供新的历史发现,但在具体操作上,对材料和方法又有着很多要求,开展起来并不容易。最近几年来,虽然量化历史研究与数字人文、数字史学等概念、提法有日渐火热之势,但真正成功和有广泛学术影响的研究并不多见。这种反差加深了许多学者对这一方法的困惑:量化历史研究是否能够在历史学界推广?如果是,又该如何做?在阅读了《官绅的荷包》一书后,个人觉得或许可以这一新著为例,从问题、材料、方法和研究者等最核心的要素出发,在讨论此书特点与价值的同时,尝试回应这样的疑问。
一、问题和材料的选择
一项量化史学研究要想取得广泛的影响,首先必须有一个高学术价值的研究问题,研究的是深入理解某种社会结构或群体行为的关键环节,是无论擅长哪种研究方法的学者都能理解和必需回答的问题。《官绅的荷包》一书,以官绅家庭资产为研究选题,即兼具很高的社会关注度和重要学术价值。
近些年中国的反腐大潮,使得官员家庭资产成了社会性话题,是一个高关注度的“显题”。在学术领域,贫富差距大、社会不平等是全球所有国家都面临的共同困境,也是学术研究的核心议题。对中国社会而言,要理解不平等形成的原因、机制等,就必须深刻思考家庭资产积累的形成以及其中财产权利与政治权力的互动与角力。研究官绅群体的家庭资产规模和结构,能直接反映社会财富的分配模式与社会阶层差异,可以从侧面展示社会经济的特点与发展阶段,学术价值可谓“显要”。
越重要的研究问题往往难度也越大,家庭资产研究便是如此。决定个人社会阶层属性最重要的指标,通常包括财富、职业与教育水平等等。但几乎在所有的国家和社会中,家庭财富信息都是其中最不公开,最难以获得的信息。而且越是社会上层,获得可靠信息的难度也越大,这给研究带来了巨大挑战。对于当代社会,学者们会采用纳税或公开的工资收入代替财富。但工资往往只反映个人的部分收入,不能全面反映家庭资产,这种不足对官员家庭资产的研究可能更为致命。因此,虽然像台湾学者赖惠敏曾利用内务府档案研究过清代皇族的经济收入,但史学界对官绅家庭资产的研究并不充分,这也反过来凸现了《官绅的荷包》一书选题的价值。
要完成一项成功的量化历史研究,是否有足够有效的材料能保证研究是更为关键的问题。实际上,任何史学研究都应该是以史料为中心,以尽可能多的获取史料为前提的。量化研究对史料的要求一样是苛刻的,材料不仅要有一定的数量,还需有一定的质量(内容),才能实现研究的目的。《官绅的荷包》作为一项成功的量化史学研究,充分地体现了这样的研究路径:官方保存的抄家档案是难得的有效理解官绅家庭资产的材料,是本书能够成功的保证。
清代官员的抄家档案具有规模大,连续性强和保存好的特点。民间社会虽然也广泛存在记载家庭资产的“分家书”等文书,但过于零散,没有系统整理几乎无法为研究使用。此外,抄家档案不仅覆盖的对象范围广,全国各地官员都有涉及,而且涵盖的时代长,清前、中、后期各朝都有。云妍此前关于抄家的研究还表明,被抄家的官绅,绝不都是“贪官污吏”,有相当多是政治斗争的牺牲品,如文字狱等。官员之外还包括一些幕友和地方绅士,如云南布政使钱度幕中的叶士元,文字狱中的江西举人王锡侯等。这大为提升了研究样本的代表性。
抄家档案的内容更是珍贵,具有很高的学术价值。它们非常全面地“穷尽”了被抄家者的全部家庭财产,大到田地房产,小到日常用品,一般都有细致的具体记录。有些家产清单中还留有当时的原始估价,这种完整性和详细度是分家书、私人日记及人物传记等其他资料无法达到的。正是因为有了这样的核心资料,《官绅的荷包》一书才能够既展现出很多生动的具体案例,又能实现系统的多变量量化分析。因此,能否获取具备一定规模、时间长度和群体代表性的史料,是能否成功的完成一项量化史学研究的前提和基础。
《官绅的荷包:清代精英家庭资产结构研究》,云妍、[美] 陈志武、林展著, 中信出版集团2019年11月出版
二、方法与表述的使用
手握可靠的资料和好的选题,一项量化研究看似成功在望,但绝非唾手可得,如何合理有效地运用研究方法是下一个关键。很多人会认为,量化研究的项目在方法上一定要追求最高明、最前沿的计算工具或分析模型,凸现“技术”的能力。但《官绅的荷包》一书在研究方法上最值得赞许的,恰恰是不过分迷恋各类高级分析工具,而是突出以史料为中心,利用各种手段和方法实现史料收集范围的最大化,努力对不同主题数据库的信息进行连接和结果互证,在平衡定性描述与定量分析方法的同时,让史料更好地服务研究问题。
量化研究论著给人的印象常常是过于专注数据计算和各类图表呈现,干巴巴的公式和结构较多,对历史进程中具体而丰满的人物和事件的描述少,可读性不强,只服务于专家同行,而将大量的普通读者抛在一边。《官绅的荷包》则不同,该书分上、下两篇。上篇是描述性的“案例篇”,对研究样本中有典型意义的案例进行具体描述,以家产资料的解读和家产的追踪复原为中心,贯穿以必要的案情叙述。其中对和绅、年羹尧等家庭资产的描述,如破案般抽丝剥茧,层层递进,不断呈现出新数据,引人入胜,令人有很好的阅读体验。虽然量化研究的基础是数据,但有学者指出:“数据”两个字有着量化的微弱气息,把过往丰富的人生经验直接降维成一些数字。因此,量化研究不能排斥定性描述。实际上,数据并非数字,而是“信息”。信息的串联、集合,可以用于统计,也可以用于描述。《官绅的荷包》开篇不是公式加计算,而是案例描述,着实令人耳目一新。
下篇“量化分析篇”则是定量分析,通过对上篇185个官绅家庭资产案例的数据汇总和分析,探讨清代官绅阶层家产结构的总体性特征,发现了一些有趣且重要的新现象。如在清代官绅家庭资产中,金融业类资产比重不低,同时各种贵重实物占据相当的份额,这与过去认为的官绅家庭财产以田地、房屋为主的认识很不同。又如发现官员家产非法性程度越高,其持有土地资产的比重越低,持有隐匿性更强的金融商业资产比重越高。这些结论是具有很强冲击力的,可以帮助学界重新认识传统时代官绅家庭的资产组成及其特点。
三、数据与人员的连接
量化数据库的建设与研究,还需要强调史料数据的连接与研究人员的连接。所谓史料数据的连接,包括“内连接”与“外连接”两方面。“内连接”是指一方面,某一数据库在建设时力争利用多来源史料中能相互匹配的信息进行连接以扩充数据库内容;另一方面,在利用某一数据库进行研究时,应注意其中信息的相互连接,以拉长研究的时段、代际或空间范围等。“外连接”主要指不同主题但内容等具有连接可能的数据库,在开放的前提下,实现相关数据信息的连接,突破单一主题数据库信息范围与广度上的局限,实现数据库建设与研究的“共享”与“共赢”。数据的“内连接”与“外连接”,一个最要的目的就是使存储于数据库中的相关信息逐步从静态走向“追踪”,即通过多种材料或数据库的互相连接,连缀起某个个人和某些群体不同时间节点的信息,形成一种“追踪数据”,使得某些历史上个人的经历能够丰富和连续得呈现出。
在很好地平衡定性描述与定量分析之外,《官绅的荷包》的作者们很好地开展了不同来源史料(包括历史数据库)的连接,尽可能地完善数据的内容和覆盖面,提升研究结论的可靠性。
如作者发现很多人物家产资料不完整或无法一次性找全,案例人物的背景信息(官职、籍贯、履历等)同样需要搜集汇总。于是他们充分利用互联网资源,将不同时空、不同出处的史料有效集中起来,形成相对完整的内容拼接。如雍正元年登州知府李元龙被抄,家产资料中并没有田产记录,但通过网上资料搜寻,在北京碑刻资料中发现了李元龙的田产信息。在完善官绅家产信息数据库的同时,作者特别注意与一些主题接近的相关数据库进行连接或结论互证、补证。如陈志武、林展等构建的“历史中国吏治数据库”,是基于《二十五史》和明清实录里面皇帝惩罚官员的记录建立的。《官绅的荷包》根据这一数据库计算了官员被惩罚的次数,以此作为官员被惩罚概率的数据以理解为官的风险。香港科技大学李中清-康文林团队构建的“清代缙绅录量化数据库”,其数据信息与本书研究内容相关性很高,作者也部分利用了这一数据库来补充自身数据。
《官绅的荷包》一书表明,从技术和研究实践角度看,充分利用技术方法进行电子化史料信息的连接、追踪的努力是非常必要的,哪怕只依靠最基础的方法,这些连接、追踪依然对提升研究质量帮助甚大。实际上,史料连接、追踪本就是史料考订、史实发现的应有之意,是今后开展量化研究必须更为关注的方向。过去学界多认为利用数据库进行史学研究,最重要的优点是对史料的大规模使用,能够“广”而“全”地使用史料。现在随着越来越多的数据库被建设起来并向学界开放,数据库数据的“连接”可能大为增加,“数据追踪”将越来越成为数据库研究的重要方法。数据库研究不仅能够“广”而“全”,也能够“专”且“深”。
数据连接之外,《官绅的荷包》一书的成功还在于研究者的“连接”,即组建了一个有分工、有实力的研究团队。一般来说,大规模量化历史研究项目往往是跨学科的,历史资料的收集与考证,量化方法的选择与使用,量化结果的研究与描述等会涉及到历史、统计和相关社会科学等多个专业领域,需要建立一直各有所长的研究团队,这与传统史学研究主要是“单打独斗”的个人研究有所不同。《官绅的荷包》作者中,陈志武教授出身金融学界,对复杂的数据分析很有心得,多年来也一直在倡导量化史学研究,对把握项目研究方向和获取资金支持等都可能很关键,云妍副研究员有着扎实的经济学学习基础和长期的史学研究经历,是研究第一负责人,年轻的经济学博士林展,对很多具体的计算分析可以做出贡献。这样的团队组合展示了量化史学研究团队化的要求。
近年来在网络数字技术发展的支持下,学界逐步形成以建设大规模量化历史数据库为基础的史学研究新风气,并逐步影响到中国史研究和进入中国学界。从全球学界来看,一些有影响力的中国史学量化研究团队开始出现,包括香港科技大学的李中清-康文林团队,香港大学龚启圣教授团队以及香港大学陈志武教授团队。这些团队都是在资深教授领导下,包括年轻教员、博士后以及研究生组成。
四、“大样本”与“偏差”
量化历史数据库的建设与研究,虽有方兴未艾之势,但毕竟是探索中的新事物。一方面,学者们有必要对各项具体研究中形成的方法和心得及时地进行总结、展示;另一方面,新方法、新尝试的不成熟之处,也需要学界的同仁一起来讨论。《官绅的荷包》在取得突破的同时,个人觉得也有些不够成熟或令我疑惑的地方。
比如本书是基于185个官绅抄家案例进行的量化研究,研究者称之为“大样本”。但无论针对全体清代官员,还是所有被抄家的官绅,这一比例都很低,与一般理解的“大样本”、“全样本”概念似乎并不相符。作者能否称之为“大样本”?在量化历史研究中,又该如何具体的定义“大样本”?作者似乎应该做出必要的说明。
还有一些研究案例,研究材料可能存在掌握不够充分的问题。如有一些官绅完全没有田产记录,作者据此认定没有此类资产。在传统中国社会家族和城乡关系体系之下,官绅家庭没有任何田产,似乎很难令人信服,应该需要作者们继续深入发掘资料,简单作为无田产处理可能会造成量化结果的偏差。
当然,瑕不掩瑜,《官绅的荷包》总体上是一项非常成功的量化历史研究。期待在这些好的研究示范和鼓励之下,中国学术界能够出现越来越多有影响的量化史学研究。