算法治理和监控资本主义
有人在看着我们,我们也意识到正在被他们凝视,但这是完全不同步的,我们根本无法与他们对视,因为有一种先验的……和绝对的不对称,一种绝对无法控制的不平衡。时序倒错是这里的法则。我们感到自己被一种永远无法对视的目光凝视着,这就是“面甲效应”。
——雅克·德里达(Jacques Derrida)
大数据有三个主要特点:持续生成;它的目标是同时做到详尽和细化;灵活生成,因此可以随时添加新的数据源。换句话说,大数据聚合了来自不同领域的信息,这些信息事先不一定相互关联。这些异构数据以不可知论的方式进行处理,即揭示其中的关系,却不解释它们。大数据的这些特性助长了一种天真的经验主义认识论,认为这种新的知识体系将通过纯粹的自动归纳法进行——数据将提供真相,而无须经过理论的干扰。但事实并非如此。它们所表达的观点必然是片面的,只有与先前构成的知识联系起来才有意义。它们并非纯洁无害。它们包含着理论,具体体现在组织它们的算法中,要知道,对规律性的探索以构建假设为前提。
大数据还带有社会偏见和统治关系。人工智能程序不仅反映了制度和权力关系中的种族或性别不平等,而且有助于放大这些不平等。它们包含的偏见反过来又被纳入其他算法结果中。例如,有研究表明,语言分析程序“单词嵌套”(Word Embedding)会将具有欧美含义的名字归类为好听的名字,而将非洲裔美国人的名字归类为难听的名字。另一个例子是,由于训练自动驾驶汽车识别行人的算法的数据库主要由浅色皮肤的人组成,机器系统检测深色皮肤行人的能力较差,因此碰撞风险较大。这些偏差在日常生活中的负面影响被称为“预测性不公正”。
大数据不是中立的。即使它们兜售的偏见和成见能够得到纠正,人们的担忧也不会减轻。安托瓦内特·鲁夫罗伊(Antoinette Rouvroy)和托马斯·伯恩斯(Thomas Berns)提出了“算法治理”的概念,它指“某种类型的规范性或政治理性,其基础是通过建模的方式收集、聚合和自动分析大量数据,提前预测并影响可能的行为”。这种形式的治理绕过了人类主体并剥夺了他们的反身性。他们总结说,算法治理的目的是在“没有形成或提出欲望的情况下产生行动”。个人被绝对化,陷入了多重决定的复杂性中,个人也被拆解了,被简化为一系列将他们限制在概率可能性中的措施。就像让-吕克·戈达尔(Jean-Luc Godard)想象的未来城市阿尔法城(Alphaville)一样,由算法统治的社会开始类似于“像白蚁或蚂蚁那样的技术社会”,在那里,“人们已经成为概率的奴隶”。
试图将存在归结为概率,有可能剥夺个人和社会对未来的控制权。被剥夺了挑战概率的能力,换句话说就是挑战现实的能力,主体就失去了所有的力量。这种 “去现实化”的风险绝非不可避免,但在“数字时代”的影响下,这种风险正在不断增加。
大他者守护着一个无法逃脱的世界
公司对大数据的利用是被肖莎娜·祖博夫(Shoshana Zuboff)称为“监控资本主义”的社会项目的一部分。该系统赖以生存的盈利战略包括预测和修改人类行为,以创造收入和控制市场。因此,监控资本主义需要单方面详尽了解人类经验,并将它转化为预测性的行为数据。在大数据的指导下,建议和解决办法提高了行为的可预测性,从而达到市场定位的目的。但监控资本主义并未就此止步。祖博夫表示,行为控制是追求更准确预测的领域。
这个“大他者”(Big Other)吸收了我们提供给它的所有数据,比我们更了解我们自己。从我们的通信细节,到我们卧室里的动静,再到我们的消费清单,它无所不包。通过大规模的在线实验,它学会了指导我们的行动,并最终体现出一种新的极权主义。20世纪的极权主义通过暴力来运作,而这种被祖博夫称为“工具主义”的新权力则是通过改变行为来运作。
虽然哈耶克和凯恩斯在几乎所有问题上都针锋相对,但他们都坚信经济学从根本上说是一个信息和知识的问题。这促使凯恩斯强调根本的不确定性及其对经济参与者心理的影响。在他看来,经济政策必须考虑到经济行为的这一心理层面,并能够通过有力的干预,抵消消极情绪转化为自我实现预期的抑郁螺旋。相反,在哈耶克看来,知识的内在分散性与公共干预互不相容。只有市场才能调动本质上无法获取的知识,因为它们是隐性的和情境性的。因此,任何对竞争态势的破坏都只会降低社会层面认知过程的质量,从而导致经济决策失误。
新积累逻辑的本质是对哈耶克和凯恩斯关注点的颠覆。核心不再是不确定性或不可知性,而是可预测性。祖博夫将监视资本家的战略视为一场“提高确定性程度的竞赛”,在这场竞赛中,他们别无选择,只能加强对社会活动的控制。亚马逊、谷歌和脸书正以各自的方式加强监控扩张与价值创造之间的重要联系。
亚马逊与推荐逻辑。亚马逊成功的秘诀之一在于它的推荐系统及其在销售环境个性化方面的优势:
亚马逊网站为每位客户量身打造了一家商店。每个来到亚马逊网站的人看到的网站都不一样,因为网站是根据他们的兴趣个性化设计的。这就好比你走进一家商店,货架开始重新排列,你想买的东西被突出显示,反之,你不可能感兴趣的东西则被排在后面。亚马逊网站的推荐系统会根据当前语境和你过去的行为,选择你或许感兴趣的少量商品。
这种个性化体验来自协同过滤算法,这种算法借鉴了其他用户的经验。不过,亚马逊发明的系统并不是将客户与其他具有相似特征的客户进行匹配,而是以物品为基础进行组织。用户购买和评估的每件物品都与相似物品相关联,然后这些物品根据接近程度被组合在一个推荐列表中。该列表通过各种指标进行完善。例如,它包括一个时间维度,以便系统整合某些购买的顺序逻辑(如文学系列的连续卷本)或个人的社会生物学轨迹(年龄增长、与孩子出生相关的周期等)。这种技术的一个主要优点在于,大部分计算都离线进行,因此系统功能强大,运行速度快。该系统非常有效。点击率和购买转化率都非常高。据说,亚马逊上约有30%的页面浏览量是通过它产生的。网飞也采用了同样的流程,80%的视频观看都要经过这一中介,这使其成为公司估值的关键因素之一。因此,推荐与行动之间的关系循环往复。目标定位的质量取决于推荐的质量;反之,推荐做法通过参与者的行动得到验证,从而为未来推荐的循环提供信息。
谷歌与语境优先级。Alphabet是谷歌的母公司,它主要是一家广告公司。2017年,广告创造了该公司收入的87%,该公司控制了全球在线广告市场33%的份额(总额2 240亿美元中的740亿美元),在美国控制了42%的份额。让谷歌发家致富的广告空间销售系统基于两个因素,这两个因素的力量结合在一起。第一个决定性因素是搜索引擎的性能。谢尔盖·布林(Sergey Brin)和劳伦斯·佩奇(Lawrence Page)发明的排名系统基于网络超文本链接的架构。第一代搜索引擎主要以关键词分析为基础,与之不同的是,谷歌的原型既考虑了指向页面的链接数量和包含这些链接的页面的相对重要性,也考虑了其他因素,如链接文本、请求位置和视觉特征(如字体大小)。这一新搜索引擎的成功源于分层原则的强大功能,它能够提供最相关的结果,即不仅能够摒弃不良结果(垃圾),还能识别那些从搜索制定者的角度来看只具有适度兴趣的结果。正是在这一功能的基础上,谷歌取得了经济上的成功。
第二个决定性因素是广告与浏览语境的相关性。这样才能在最坏的情况下限制广告对浏览体验的破坏,在最好的情况下确保网络用户对广告有积极的看法。广告定位的精细程度取决于对关键字、浏览历史和谷歌生态系统中收集的大量其他数据的分析。这些丰富的语境信息实现了极为精确的定位,从而提高了广告引发点击的可能性。最大限度地提高广告商所追求的行为效果,可以增加广告空间的价值。
2010年代,Alphabet实现了多元化,扩大了它在网络安全(Chronicle)、人工智能(Deepmind)、智能家居(Nest的恒温器、摄像头、传感器、报警器和可视门铃)和自动驾驶汽车(Waymo)领域的活动。2018年,当Waymo这家子公司在亚利桑那州的道路上推出第一辆机器人出租车时,其估计价值(在700亿~2 500亿美元之间)有可能超过大众(750亿美元)和丰田(1930亿美元)等最大的汽车制造商。Waymo的盈利策略不是制造更好的汽车,而是将汽车作为一个生活空间、一个移动空间来控制,进而成为一个“数据井架”。《金融时报》(Financial Times)上瑞银(UBS)的一份报告详细解释了这一点:
Waymo的威胁不在于制造更好的汽车。该公司并不需要。恰恰相反,它从克莱斯勒和捷豹(沦为供应商)那里订购汽车,然后为它们配备内部制造的自动驾驶软件和硬件。但它的潜力远不止于卓越的自动驾驶能力。一旦机器人出租车成为主流,Alphabet 就能从谷歌地图和搜索中收集数据,通过YouTube和Play Store为乘客提供娱乐,通过谷歌智能扬声器提供建议,并利用它的软件能力管理车队。瑞银解释说,除了车辆本身,Waymo还是一个垂直整合的“封闭系统”。蒂尔先生(Mr. Thill)补充说,机器人出租车的利害关系“将影响广告、媒体和娱乐行业”。重要的不仅是自动驾驶技术,还有谷歌为汽车带来的所有组件。这些都很重要。这也是该公司在客厅设备上投入巨资的原因——它希望汽车看起来像你的客厅。
数据收集、整合和处理指导着谷歌的扩张,目的始终是根据个人和语境提供最相关的产品。公司创始人兼首席执行官劳伦斯·佩奇说:“谷歌的问题在于,你必须向它提出问题。它应该知道你想要什么,甚至在你提出要求之前就告诉你。”因此,锁定目标是为了预测行为,更是为了引导行为。
脸书与广泛的软件整合。语境化的原则在不断完善。它倾向于整合每个人在活动中留下的所有数字痕迹,包括与他们的社交网络、行动、购买历史有关的数据,以及他们的个人信息(甚至是隐私信息)、行政信息、财务信息和职业信息。事实表明,脸书直接从某些移动应用程序中获取数据,而用户并不知情。比如一款名为Breethe的冥想程序和另一款名为即时心率检测(Instant Heart Rate)的程序,后者被吹捧为“第一款最快、最准确的便携式心率监测器”。再如一款名为Flo的应用程序,它记录三十多种症状和活动,以便“通过人工智能生成有关月经周期和排卵期的最准确预测”,并承诺“通过检测反复出现的身体和情绪模式更好地了解你的身体”。在以上种种例子中,有关冥想、心率或排卵期的信息都会被传送到脸书。
收集的数据来自内置应用程序或网站中的小程序,被称为软件开发工具包(SDK)。软件开发工具包通过以下先进的功能使公司得以增强:它们向分析平台传输数据,例如会话数量和持续时间、位置、使用的终端类型,以及用户在应用程序中输入的信息,这让公司能够更好地了解用户行为并向他们投放更具针对性的广告。
脸书分析(Facebook Analytics)提供“以人为本的全方位渠道分析”。借助“从二十亿人的社区中收集的统计数据”,脸书分析承诺,帮助企业家深入了解人们在网站、应用程序、脸书页面等渠道与企业家的业务互动的方式和位置。该观点契合了非规模化的论点,小规模运营可以与大数据的力量相结合。这家大型公司正在提供复杂的信息技术服务,而这类服务对于中型公司来说通常难以独立提供。
通过软件开发工具包,社交网络可以访问其他个人数据源,并将这些数据与它已有的用户数据链接起来,从而强化对个人存在的了解。这使得社交网络能够进行复杂的市场研究,为算法过程提供数据,以便精细地选择要在用户个人页面上显示的内容,当然,也可以兜售越来越有针对性的广告。《华尔街日报》(Wall Street Journal)调查了软件开发工具包,报道称,这些移动应用程序数据对脸书的利润至关重要:
脸书积累了有关用户行为的知识,该公司可以为营销人员提供比大多数其他公司更好的投资回报。例如,当营销人员想针对喜欢运动的用户或正在购买新跑车的用户投放广告时,这些广告的每次点击价格会更高。这就是脸书收入增长的原因。
在这场提取相关信息的资源竞赛中,网络巨头们对自己收集的数据或从合作伙伴那里获得的数据严加防范。但它们也求助于专门编译文件的代理商来补充它们的数据:
甲骨文拥有或合作的数据代理商有八十多家,它们提供了海量的数据……包括消费者购买行为、金融交易、社交媒体行为和人口统计信息。该公司声称出售全球三亿多人的数据,每个人拥有三万条数据,“美国80%以上的互联网人口都在你的指尖”。
知悉每个人都有三万个属性,再加上错综复杂的跟踪设备,我们可以对每个人都了如指掌。这种通过系统化探索数据而获得的信息优势构成了祖博夫所说的“行为剩余”,这是一种整体知识,它为控制这种知识的组织提供了一个居高临下的位置,使它只根据自己设定的目标来调动这种知识。这样,与用户相关的信息只有在符合价值要求的情况下才会被披露。
祖博夫论点的新颖之处和优势在于,它指出了这一动力将把我们引向何方。监控资本主义的目标不是提高行为的可预测性,而是控制行为。这可以通过微妙的激励措施来实现,比如《宝可梦GO》(Pokémon GO)这款游戏,它的商业模式的理念是向商家收取费用,引导人群前往对商家更有利的目的地。这还表明,它可以更具侵入性,例如远程扣押逾期偿还贷款或逾期支付保险费的人的联网车辆。远程信息处理技术、远程计算机化管理程序都有一个明确的目标:
远程信息处理不仅关乎“了解”,还关乎“做到”……。它承诺通过旨在改变行为以实现最大盈利能力的机器流程来降低风险。行为剩余被用来触发制裁,例如实时票价上涨、经济处罚、宵禁和发动机堵塞,也被用来触发奖励,例如票价折扣、优惠券和奖赏以换取未来的福利。
在祖博夫看来,监控资本主义的公司正在建立一个大他者的基础设施,它从我们的社会经验中汲取无限的资源,对这些资源进行重新安排,并以行为指令的形式返还给我们,从而从根本上削弱了我们的自主性。这个大他者是雅克·德里达意义上的“幽灵”。面对大他者时,有彻底的不对称性。它拥有“权力的最高徽章——看到他人而不被看见”,作为个体的我们则陷入了“‘面甲效应’——我们看不到谁在看着我们”。然而,与大多数幽灵不同的是,大他者不只是存在于我们的生活中,它还玩弄我们的生活。它通过推荐、建议和义务来塑造我们的生活,对我们的行为产生深远影响,从而激活自己的力量。祖博夫向我们表明,监控资本主义的繁荣是以牺牲个人自治的完整性为代价的,它直击人类生存条件的核心。
《技术封建主义》,[法]塞德里克·迪朗著,陈荣钢译,中国人民大学出版社,2024年7月出版
【本文节选自《技术封建主义》】