数字与劳动
在此,我思考数字资本主义下的反抗以及劳动的经验诠释
具体性、冲突性和焦点性:对中国社会媒体审查制度的系统调查
  1. 具体性、冲突性和焦点性:对中国社会媒体审查制度的系统调查
    1. 介紹
    2. 微信和WeChatscope
    3. 資料與方法
    4. 結果
      1. 专题性的各种挑战性文章
      2. 特殊性和审查制度
      3. 冲突和审查制度:国际贸易文章的一个例子
      4. 焦点问题和在线审查制度:对调查结果的理解
    5. 结论和局限性

具体性、冲突性和焦点性:对中国社会媒体审查制度的系统调查

來源:Specificity, Conflict, and Focal Point: A Systematic Investigation into Social Media Censorship in China

中国的互联网审查机制是高度动态的,尚未被现有的理论所完全解释。本研究通过研究2280对被审查的微信文章和相匹配的其他文章之间的差异,来审视中国社交媒体的发布后审查制度。在排除账号属性和文章主题的影响后,我们发现文章的特殊性提高了被审查的几率。此外,对国际贸易文章集的研究表明,这类文章的文本单元披露了冲突,甚至是亲政府的言论,也会被审查者删除。这项混合方法的研究将焦点作为一个理论角度来理解中国的内容监管体系,并提供了基于大规模的、非专有的和原始的社会媒体数据的证据来研究中国不断发展的审查机制。


介紹

一些学者认为,在中国这样的非民主国家,公众对互联网的访问是一种促进公共领域、公民社会和民主发展的力量(Lei,2017;Qian & Bandurski,2011;杨,2009)。然而,这种相当乐观的观点与众多研究形成鲜明对比,这些研究表明,互联网自由可以通过有效地采用和调整监管网上公共言论的措施而被国家干预压制。事实上,学者们认为,互联网技术在很大程度上促进了专制政权的复原力,因为国家采取了积极主动的策略来引导或转移公共话语,以及遣散在线活动主义(Gunitsky,2015;MacKinnon,2008;Sullivan,2014;杨,2018)。

在关于中国公民社会的讨论中,最核心的是中国的互联网审查模式。众所周知,在中国,使用互联网进行公共表达是受到严格管制的。由互联网基础设施(如长城)、中央和地方政府官员以及技术公司组成的复杂的信息控制体系正在不断发展(自由之家,2018b)。关注中国互联网审查机制的研究,考察了审查的对象和中国网民规避政府控制的方式,以及政权操纵舆论的积极行动(Fu, Chan, & Chau, 2013; King, Pan, & Roberts, 2013, 2014, 2017)。尽管大多数研究都认为审查制度的主要目的是维护政权的合法性和稳定性,但对于审查制度究竟是如何运作以实现这一目标,即审查制度的主要目标是什么,它们存在分歧。研究之间的分歧可能与审查机制的动态以及信息和通信技术(ICT)的发展有关–因为它与在线公共领域如何被启用和监管有关。

一方面,学者们认为,中国政府通过部署战略审查的方法,在限制媒体内容方面变得更加适应和动态(Lorentzen,2014),认为内容监管不是简单的一套固定的规则,而是可能有时放松,然后收紧,以应对社会紧张局势和公众意见(Chen & Xu,2017)。例如,在2012年钓鱼岛/尖阁危机的整个过程中,网上的民族主义帖子并没有被统一允许或审查(Cairns & Carlson, 2016),甚至亲政府的民族主义者的观点有时也被当局审查(Zhang, Liu, & Wen, 2018)。众所周知,集体行动的帖子是最有可能被审查的话题(King等人,2013);然而,研究也显示,大量的集体行动帖子通常没有走红,根本没有被审查。人们认为,政府对新闻和公共表达的容忍程度会随着时间和不同(虚拟)空间的变化而变化。

另一方面,中国在ICT发展和网络空间监管方面至少有两个变化值得注意。首先,市场上的社交网站的多样性已经明显减少。QQ校友录、人人网、新浪空间、51. com)曾经是2009年左右最受欢迎的网站(CNNIC,2019),而科技三位一体–百度、阿里巴巴和腾讯,统称为BAT–在短短几年内就开始主导中国的数字市场。据报道,2015年,80%的市值来自三巨头,总市值超过5000亿美元。此外,少数玩家的主导地位使得新成立的挑战者或国际玩家难以成功(Sender, 2015)–只有极少数例外,如流行的社交应用TikTok(豆瓣)。在这三家公司中,微信的所有者,专门从事社交媒体的腾讯,被一些人视为最 “可怕 “的一家(The Economist, 2017)。

第二个变化是,正如Lv和Luo(2018)所指出的,中国中央层面的互联网治理在体制上是分散的,国务院及其工业和信息化部(MIIT)负责互联网的发展,而互联网的监管则由习近平主席领导的中央网络空间事务委员会(CCAC)1监督,这可能导致这两个机关之间的分歧,因为它们的主要目标(即经济增长与维护稳定)有些矛盾。然而,这种分裂可能没有那么突出,因为中国互联网协会从其他部门集中了有关互联网治理的权力,同时坚持把审查作为其主要任务(Lv & Luo, 2018)。这两种变化都预示着中国的中央集权,一种是由电子政务反映的政治权力,另一种是ICT业务,如果不是在其他商业部门的话。

在中国数字治理不断发展的这一动态背景下,以及以往研究中不一致的结论,我们重新审视信息监管在塑造公共领域中的作用,此时中国ICT的发展和监管都是集中化的,而且自2017年新的《网络安全法》开始,互联网控制被认为进一步收紧,网上匿名被终止(Denyer,2017),网上活动主义受挫(杨,2018)。特别是,我们调查了通过发布后审查(即删除已发布的信息)的行为,在界定网络公共领域的边界方面有什么贡献。指导本研究的问题如下。在中国的社交媒体上,被审查的内容和剩余的公开内容之间有什么细微的差别(例如,术语、短语和段落等文本单位)?我们如何从概念上理解这种差异在中国审查机制中的作用?

由于没有系统的数据收集,很少有中国审查制度的研究能够从大规模和纵向的经验证据中得出见解。在那些有限的研究中,大多数研究集中于短小的在线文本内容(例如,类似Twitter的中国社交媒体平台新浪微博),一些研究是通过非透明的抽样方法进行的,还有一些研究是根据相当有限的用户数量和类型贡献的内容(例如,在线论坛和地方政府官员之间的电子邮件;Fu等人,2013;King等人,2013,2014,2017)得出结论。因此,我们开发了一种透明的、系统的、纵向的数据收集方法–WeChatscope,以自动监测在线审查,并获得一段时间内有关审查内容的原始数据。

在这篇文章中,我们采用混合方法设计的归纳方法,在比较被审查的和剩余的社会媒体数据的基础上,探索网络审查的可能机制。我们首先介绍了为监测和检测中国互联网审查制度而开发的WeChatscope系统,当无法通过平台提供的应用编程接口(API)获取数据时,这个系统可以被采用(经过一些修改)进行自动化数据收集,例如封闭的消息系统。然后,我们提出了我们的主要发现,从总体上看,被审查的微信文章与其他文章不同,具有更高的内容特异性。我们还介绍了一个基于文章子集的例子,以证明其他文本单位(如短语、句子和标志着冲突的段落)也是审查决定的可能因素。由于现有文献大多根据内容的政治含义来理解互联网审查决定,本研究随后提出了 “杀死焦点 “作为对经验观察的解释,即社交媒体内容的某些文本特征与被审查的更大可能性有关。

微信和WeChatscope

据报道,截至2019年12月,微信的月活跃用户超过11亿(腾讯,2020年),现在是中国领先的社交媒体平台。作为一个超大型的一体化应用,微信集成了基本的在线功能、私人信息、群聊、在线游戏、电子支付和博客;它还提供了用户可以订阅的 “公共账户”(或 “官方账户”)。微信公众账号的功能与Facebook页面类似,可以公开访问,被公司、组织、媒体、名人和个人用来播放媒体内容并与目标用户互动;当他们关注的公众账号发布新消息、文章、图片或视频时,用户会收到推送通知。2017年,月度活跃的微信公众账号数量达到350万个,活跃粉丝797,000,000人(腾讯,2017)。鉴于微信公众账号在中国媒体体系中的重要性,当前和未来的学术研究非常需要系统的数据收集–然而,即使是微信上的公众内容,也不方便通过网络浏览器和不使用应用程序来访问,这为大规模收集微信公众账号数据又增加了一层难度,更何况微信没有向公众提供开发者API。因此,我们开发了WeChatscope系统,它采用了 “应用爬行 “技术,利用微信的桌面应用来收集微信公众账号的数据。

WeChatscope系统的工作分为三个主要部分(图1)。首先,我们创建了一些个人微信账户,每个账户都订阅了我们样本中的一些公共账户。然后,我们使用微信桌面程序,在每天早上7点到第二天凌晨12点30分对被抽样的公众账号进行监测,以获得他们发布的新文章的唯一统一资源定位器(URLs)。第二,获得的已发表文章的URL被存储在一个缓冲区中,然后一组后台运行的网络爬虫逐一获得这些URL,并在无头浏览器中访问这些文章,将元数据(文章标题、发表日期、公共账户名称)和媒体内容(文章中包含的文本和图片)存储在一个关系数据库中。第三,系统再继续监测这些已发表的文章48小时,在每天早上7点到第二天凌晨2点之间,每小时重新访问这些文章,检查文章是否被删除–如果被删除,记录网页上显示的返回的删除系统信息。最后,WeChatscope允许公众通过我们自行开发的应用程序接口(API)4访问公开数据,公众可以通过这些接口获得被删除文章的信息,如标题、公众账号名称、发布日期、删除日期、删除信息,以及系统捕获的被删除文章的全文。

img

資料與方法

在本研究中,我们使用微信公众号收集的样本,获得了2560个公众账号在2018年3月1日至10月31日期间发布的818393篇微信公众号文章5。在这个样本中,有8736篇文章在发布后被删除,原因有六:被内容所有者删除(5945),内容违规(2345),账号被封(272),版权问题(148),账号迁移(25),以及被多个用户举报(1)。我们将因 “内容违规 “而被删除的文章定义为 “被审查的文章”,因为这些文章是由微信平台管理员强制删除的,而管理员的决定是由政府审查部门指导的,并没有向公众提供明确的理由(例如,违反了哪条规定)。

我们部署了一个案例控制匹配策略,将每篇被审查的文章与同一公众账号中剩余的一篇与被审查文章主题最相似的文章配对。这一策略的部署是为了调整公共账户的属性(如账户类型和受欢迎程度)和公共账户发布的主题变化可能带来的混杂影响,因为我们试图研究细微的因素,即文本术语,以解释被审查的文章和剩余文章之间的差异。我们通过从包含被审查的文章和同一账户在目标被审查的文章发表前后1周内发表的剩余文章的语料库中构建一个话题模型来进行这种案例控制匹配。主题模型,如Latent Dirichlet Allocation(LDA),是通过检测潜在的主题(即词组)来探索大型文件集的有用工具,而不需要文件中文本以外的其他知识。我们采用相关主题模型(CTM),因为它提供了一个更现实的模型,放松了主题之间独立的假设8,也更适合数据(Blei & Lafferty, 2007)。与LDA和其他许多主题模型类似,CTM将每个文档视为一个主题的组合,每个主题是一个词的混合物。

通过进行残差分析(Taddy,2012)以及考虑语义连贯性和排他性,发现有160个话题的模型9是最简明的拟合模型,并得到一个包含语料库中每篇文章的话题分布的文档-话题矩阵;换句话说,每篇文章被向量化为160个维度。有了这个文档-主题矩阵,我们根据余弦相似度得分,为每篇被审查的文章选择最相似的剩余 “候选人”。最后,我们得到了一个由4560篇文章组成的样本10,其中有来自751个公众账号的2280对被删减的文章和剩余的文章。11 因此,我们的最终样本包含了我们观察到的被删减的文章和他们被选中的对应文章,因此,这一对的每个成员在两种意义上是相似的:他们是由同一个微信公众账号发布的,他们在潜在主题方面的构成相似;但是,他们中只有一个被删减。

由于本研究的一个重要目标是找到改变在线审查决定的未观察到的细微差别,我们首先采用随机森林(RF)方法来模拟对一篇文章进行审查与否的分类。具体来说,我们这样做是为了发现那些在预测一篇文章是否被审查时比其他术语更重要的文本术语。因此,我们选择了RF,因为它具有处理大量输入变量的优势,而每个变量都能提供少量的信息(Breiman,2001);在我们的案例中,我们在收集的文章中有很多词语,我们想了解它们对审查的影响程度。RF是一种建立在分类和回归树(CART)方法之上的集合方法(Breiman, Friedman, Stone, & Olshen, 1984)。CART产生决策树,根据二元分割进行预测(即预测分类树的类别):在每次分割时,考虑一个条件(例如,一个变量的值),将数据中的案例分为两组,这两组的内部比当前组更同质(或更纯)。根据定义,RF是 “一个由树状结构的分类器集合组成的分类器,其中……每棵树都投出一个单元。…每棵树为最受欢迎的类别投下一个单位的票…”。(Breiman, 2001, p.6)。它通过装袋12和在每次分割时随机选择输入变量的子集来扩展CART;对于分类,它使用基于森林中最常见的决定(即多数票)的 “袋外”(OOB)估计来预测类别。在本研究和其他许多研究中,RF是首选,至少有两个优点:它是非参数性的,没有分布假设,而且不会因为大数法则而过度拟合。

尽管RF能够处理大量的预测因子(通常是数百或数千),但在我们抽样的微信文章中,潜在的预测因子(即词)的数量远远超过数千–这是在对大量文件进行文本分析时面临的共同挑战,当这些文件是像我们样本中的长篇文章时更是如此。因此,我们对数据进行了预处理,首先对文本中的中文词语进行分割,并去除标点符号、数字、停顿词和只包含一个字符的词语。其次,我们用大词标记器对语料库中的每个文档进行标记,并建立一个具有词频-反词频(tf-idf)加权的文档-术语矩阵。第三,我们计算每个术语的卡方分数,以获得反映两组不同文章(即被审查的文章和剩余的文章)的判别能力的排名。然后,我们选择那些具有较高卡方值的术语作为预测文章状态的输入特征:被审查和剩余。

我们还对上述的计算性文本分析进行了补充,以文章的一个子集为例进行了仔细阅读(close textual analysis; Allen, 2019),以证明其他文本单元如何共同有助于决定审查的决定,这可能不是简单地检查分段的词所能捕捉到的。近距离阅读是一种方法,它 “调查话语内部运作之间的关系,以发现是什么让一个特定的文本具有说服力的功能”(Allen, 2019, p. 137)。因此,我们将这种方法应用在文章的子集上,作为一个文本的集合,寻找文本的承载物说服审查员必须从互联网上删除。特别是,这种分析的主要目标是找到文本中的重复部分–这个子集中被审查的文章所共有的共同元素和主题。

結果

专题性的各种挑战性文章

最后的4,560篇微信公众号文章样本,要么是被审查的,要么是与被审查的语义相似的,代表了 “具有挑战性 “的文章,这些文章有可能成为中国社交媒体上不受欢迎的内容–它们可以是关于各种主题的(见表四),由CTM根据这些文章来确定。主题标签是根据每个主题的关联词和文章来分配的。16 在被识别的主题中,一个主要的主题是经济,最常见的主题是国际贸易,重点是中国、美国、日本和朝鲜之间的贸易,这占了样本中所有文章的6.8%。事实上,在排名前20位的话题中,几乎有一半与经济有关,合计比例为27.5%:贸易、科技公司、经济和金融、住房市场、”国进民退 “17 、崔永元18 、多层次营销、社会保障税,以及贫困。

我们首先测试了在决定一篇文章是否被审查时,某些主题是否比其他主题发挥了更重要的作用。为此,我们构建了一个RF模型,以每篇文章的主题比例作为输入变量,预测一篇文章是否被审查。这个最初的射频模型19 的表现只比简单的抛硬币好一点,因为它只能正确预测52.68%的文章状态是被审查还是不被审查。这个结果并不令人惊讶,因为我们根据所有文章的主题分布来选择剩余的文章与被审查的文章配对,为每篇被审查的文章挑选最相似的剩余文章。这种低的预测成功率也在某种程度上证实了我们的选择策略在减少被审查文章和剩余文章之间的主题差异方面是有效的,因为所识别的主题在区分文章的状态方面不能作为很好的预测因素。尽管在每个单独的配对中,被审查的文章和剩余的文章之间的主题差异被有意地尽可能地减少,但总的来说,主题分布差异仍然有助于预测文章的状态,因为预测的总体错误率(47.32%)略低于随机机会。在60个主题中,主题32(小说和故事I)和主题49(食品和健康)是在提供预测准确性方面比其他所有的预测因素更重要的两个预测因素。当涉及到审查决定时,这两个问题更像是 “家务事”。许多由这两个主题之一组成的被审查的作品要么有严重的色情内容,要么有可能被视为 “谣言 “的内容,例如,没有科学证据的健康建议。

特殊性和审查制度

我们以更高的粒度测试了第二个模型:使用文本术语作为预测因素,对被删减的和剩余的微信文章进行分类。如上所述,我们对文章中包含的术语根据其卡方值进行排序,并选择那些数值较高的术语作为这个RF模型的输入变量。这个RF模型用2029个词来预测4560篇文章的状态23–它的OOB估计错误率降低到33.25%,而初始模型的错误率是47.32%。

我们进一步衡量术语的重要性和危险性,分别计算每个术语的RF重要性得分,表示如果文章被审查,术语在分类中的重要性(越高越重要),其审查与保留的比率(CR比率)如公式1所示:

img

例如,”政府 “一词在被审查的文章中出现了2377次,在其余文章中出现了1747次,那么它的CR比是1.36,也就是说,”政府 “一词在被审查文章中出现的次数是其余文章的1.36倍。CR比大于1的术语是指在被审查的文章中比在其余文章中更经常使用的术语;换句话说,CR比大于1的术语(即危险术语)可以被看作是更有可能触发审查系统的术语。

图2绘制了1528个在识别被审查文章方面很重要的危险术语的分布情况(即其RF重要性得分大于0且其CR比率大于1的术语),两种颜色代表它是否是一个特定的术语,也就是说,它是否是一个对象的唯一标识。虽然80%以上的重要危险词汇是一般词汇,而且重要性最高的词汇也大多是一般词汇,如政府(government)、谈(speak of)。拆除),而危险性最高的词汇则多为特定词汇,如中国华信、湖畔大 学、陶崇园等。

img

图3显示了被审查文章和剩余文章的关键特定术语(即重要的、危险的和特定的术语)的不同分布情况–虽然这两组文章大多集中在0(即没有关键特定术语),但剩余文章的数量(1280)高于0时的被审查文章(775),而一旦关键特定术语的数量超过3,被审查文章的数量就会普遍增加。我们通过评估每篇文章中的关键特定术语的数量(n)和被审查的几率(ORn)之间的相关性,进一步研究文章的特殊性和被审查的机会之间的关系,如公式2所示:

img

ORn被计算为每个关键特定术语频率n的被审查文章数量与剩余文章的比率,定义为每篇文章中出现的关键特定术语的数量。例如,有775篇被审查的文章含有0个关键特定术语,1280篇剩余文章含有0个关键特定术语,那么OR0 1⁄4 (775 þ 0.5)/(1,280 þ 0.5) 1⁄4 0.606;也就是说,在关键特定术语频率为0时,被审查文章的数量大约是剩余文章数量的0.6倍。为了了解当关键特定术语的频率增加时,被审查的几率是否增加,公式3显示了给定的关键特定术语的累积频率(ORCUMn)的几率:

img

图4a显示,当文章不包含关键特定术语时,被审查的几率很低(0.606),而当文章包含30个这样的术语时,其峰值为15。图4b表明,随着文章中包含的关键特定术语的数量增加,被审查的几率也会增加。由于在一篇文章中重复出现的特定术语可能不会有进一步的贡献,例如,发现一个敏感术语在一篇文章中出现两次或十次可能不会对审查员的决定产生很大的影响,我们进一步测试了基于独特术语的特异性和被审查的几率之间的关系。在图4c和d中,特异性是以每篇文章中独特的关键特定术语的数量而不是总出现次数来计算的(也就是说,无论这些术语在一篇文章中再出现多少次,都只计算一次)。图4c显示,当文章包含11个独特的关键特定术语时,赔率达到了21,而图4d再次表明,随着文章特异性的增加,审查赔率也呈增长趋势。最后,我们用逻辑回归模型研究了文章中关键特定术语的数量对删减的影响。表1显示,平均而言,当微信文章中增加一个关键特定词汇时,被审查的几率要高1.06(95%CI:1.054,1.074)。此外,如果增加一个独特的关键特定术语,其几率会高出1.45(95%CI:1.385,1.508)。

img

冲突和审查制度:国际贸易文章的一个例子

模型2的错误分类率约为33%,其中一个可能的解释是这个文章集的多样性,因为上面提到的CTM识别了大量的主题,而且文章中使用了大量的独特术语(即2,783,450个独特术语,不包括只有一个字符的术语)。因此,第三个模型主要关注那些主要关于最常见的主题,即贸易的文章,28 以及这些文章中包含的术语29。这个最终的模型用1236个术语对270篇贸易文章进行分类–132篇被审查的文章和138篇剩余的文章–结果错误率大大降低,为21.11%,30也就是说,几乎80%的文章状态被正确分类(表Sii)。在1236个特征中,有730个被估计为重要性大于0。对于主要是关于国际商业贸易的文章,484个重要词汇(即RF变量重要性大于0的词汇)是危险词汇(即CR比率大于1的词汇),另外239个词汇是不危险的(CR比率小于1)。我们发现,一些重要的危险性词汇是与商业直接相关的命名实体(如公司和产品的名称),而重要的非危险性词汇组则不是这种情况。看来,被审查的关于贸易的文章的内容整体上比剩下的文章的内容更具体。

然后,我们研究在被审查的主要关于贸易的文章中是否以及如何使用特定的术语和其他文本单位。从270篇贸易文章中,我们共选择了102篇文章(96篇被删减的文章和6篇剩余的文章)进行仔细的文本分析。被选中的文章中包含了对区分文章是否被审查以及对被审查文章的特征最重要的词汇(即具有高射频重要性和高CR比率的词汇)。分析表明,微信公众号文章作者在写国际贸易时不仅涉及国际事务,也涉及国内事务。表Siii中汇总了有代表性的删减文章。不出所料,大量的贸易文章完全或至少部分涉及中美之间的贸易争端;中国与日本、朝鲜和非洲以及欧洲的一些国家的关系也被涉及。这类文章所涉及的国际事务的主要主题包括对外关系(特别是中美关系)的影响,中美、贸易不平衡,以及中国在世界上的野心和侵略性。

中美关系的影响至少可以用四个要素来说明。(a) 对中国来说,与美国的关系在过去和未来的增长和发展中起着举足轻重的作用,(b) 两国之间的贸易战进一步升级,(c) 贸易战不会很快结束,(d) 战争超越了贸易,可能是 “新冷战 “的开始甚至导致热战。下面的例子摘录表明,中美关系或贸易争端的影响是如何在这类文章中揭示出来的,因为它们提到了:

这种关系(如美国的援助和两国之间的和解)在历史和中国未来经济发展中的重要性。

美国向中国提供的军事援助比它向盟国提供的要高,这……为中国 “改革开放 “的伟大战略以及中国在过去40年中的快速增长和发展奠定了基础。

一个月后,我们将面临两种(不同的)结果:一种是中国和美国在中国的市场改革上和解并合作,另一种是谈判破裂,这将像观看一部灾难片。也许未来一个月是中国命运的关键时刻。

贸易战升级。

贸易战升级了! 2000亿还不够?对另外2760亿美元的商品征收关税。.

中国可能两次误判了特朗普政府的意图。.反复的误判使中美贸易战一次次升级。

它的长期性(例如,预测长期贸易战),以及其更广泛的影响(如两国之间贸易以外的其他争端)。

就像马云刚才说的,贸易战会持续20年……贸易战一旦超过3年,两国就会陷入全面对抗,剩下的17年也不会像贸易战时期那样轻松–金融战、经济封锁、冷战等都可能相继发生。

美国挑起的贸易战对中国构成的威胁已经超出了贸易本身。其他领域,如双边投资、知识产权、战略产业,特别是高科技产业,也被卷入其中。它还延伸到南海争端和台湾问题 ……

. .虽然它(贸易战)被代表为经济战争,但如果继续升级,不能排除军事战争的可能性。

除了美中贸易争端的重要性和影响之外,少数被审查的文章要么将这样的争斗归结为美国对中国的逆差导致的贸易不平衡,要么暗示这样的商业关系对美国不公平,比如说:

…中美贸易关系极其不平衡;美国在中国的投资受到高度管制…。中国和美国迫切需要通过向美国开放中国市场,以及为美国投资者创造一个公平和无歧视的市场来消除贸易争端。

第三个主题表明,中国是世界上的一个侵略者,可能被一些人视为许多其他国家的共同敌人。这些文章包含了这一特征的元素,提到了以下内容。(a) 表示中国 “伟大”,比其他国家,特别是美国做得更好的术语和句子(例如。”中国赢了,”中国制造2025 “计划要求成为 “制造业超级大国”,中国有实力和信心与其他国家抗衡),(b)中国对美国和日本等一直为中国经济进步做出贡献的国家忘恩负义–文章标题为 “美国在过去100年里有多慷慨? “和 “日本将终止对中国的官方发展援助:我们应该说’谢谢’吗?”这些文章对中国对这种外国援助的态度提出了质疑,(c)形成国家联盟,要么反对中国,例如:

. .特朗普的真正目的是迫使他们(欧盟和日本)加入对中国的征服。
朝鲜-美国峰会:两国 “和解”,中国接下来会做什么?
下一步怎么做?
美国、欧盟和日本已经开始形成一个新的共同市场……我们无法阻止全球经济的趋势,可能会再次成为一个局外人。

甚至是与中国保持一致:

上海合作组织的成员可以被看作是中国的好朋友。印度是一个新成员…只是希望它不会与美国和日本结盟。
… 意大利已经踏上了与中国合作的道路。这可能带来经济机会,但也可能使这个国家受到中国的影响。意大利对中国的接受也可能破坏欧洲国家之间关于中国政策的协议。

和(d)) 例如,中国与非洲国家的接触可能被一些人视为经济殖民主义:

当世界担心中国将对非洲进行经济殖民时,在中国却被质疑:中国是一个 “国际笨蛋 “吗?面对严重的经济衰退,小企业需要帮助,以及医疗服务、社会保险和教育的预算长期不足,为什么与朋友分享中国6000亿美元的外汇储备,却不与家人分享?

上述摘录还显示,除国际关系外,一些被审查的代表文章将议程扩展到国内事务,而主要议题仍然是国际贸易。一位作者在一篇关于贸易战的审查文章中直接指出,对中国来说,真正重要的是其内部问题:

每个问题都是内部问题。中国的历史表明,问题大多来自内部,很多时候,外部因素只是最后的推手。以中国目前的经济为例。政府)印更多的钱来维持经济增长,但过多的货币印刷带来了一系列的问题 产能过剩、巨额债务、高杠杆率、资产泡沫……。

所涉及的国内事务主要以经济要素为特色,如国内经济的结构和政策–其他经济要素包括资本外逃导致的失业、美国制造材料的可能短缺(如棉花和高性能芯片),以及银行的坏账。所涉及的一些国内事务从经济问题扩展到政治问题甚至国防问题,如政府腐败、对政府官员的不信任、政治制度(民主与非民主)和武装力量。例如,一篇题为《美朝达成协议,中国面临内忧外患》的文章提到:

(中国)的内部问题反映在腐败的加剧上。…以及公众对政府官员信任度的降低。. . 像徐才厚这样的军队腐败官员已经破坏了公众对其战斗力的信任。. . 中国最紧迫的问题是其’国内矛盾’。

此外,一些关于议程设置和言论自由的社会元素也是这些被审查文章的一部分。例如,一篇题为 “美国真的试图遏制中国的崛起吗?”的审查文章的作者表达了与中共官方报纸不同的观点。

8月9日,中国的主要官方媒体《人民日报》发表了一篇社论,断言美国肯定要阻挠中国。.因为它威胁到美国的地位。由于中国现在是世界第二大经济体,无论中国做什么,美国都会遏制中国的崛起。. . 我认为这个论点没有坚定的理论支持。.中国如何崛起决定了美国是否要遏制中国的崛起。

作者继续对《人民日报》的论点所依据的 “理论”(修昔底德的陷阱)进行了简要总结。然后他说,如果两国都是 “民主国家”,都有 “公开 “的言论,”政府由人民’自由’选举”,那么两国的竞争可能是 “公平和友好的”。作者还明确指出,中国领导人警告说,两国不应该落入修昔底德的陷阱,并质疑《人民日报》为什么还提出这种说法。这个例子表明,与主流媒体不同的观点–甚至不质疑政府本身–可能无法在审查制度下生存,暗示中国缺乏表达自由也是如此,更不用说明确指出中国阻碍信息流通,以及监控和控制其公民的生活,正如其他关于对外关系和贸易的审查文章所显示的那样。

通过仔细研究有代表性的被审查文章,我们首先发现,特定的术语(如个人、组织、国家和政策的名称,以及货币价值)确实在这些文章中被频繁使用(例如,见上述摘录中的黑体术语)。其次,我们发现,虽然在有代表性的被审查文章中发现了各种主题和元素,但这些文本单元有一个共同点:它们要么直接指出中国正在或将要遇到的外部或内部冲突的可能性,要么揭示、暗示或暗示这种冲突的加剧。中美贸易争端作为2018年讨论最多的问题之一,本身就是两国之间的冲突;当它被描述为激化时,例如在时间(即长期冲突)、领域(即贸易以外的冲突)和放大(例如重要性、不平衡和升级)方面,文章可能不被允许留在社交媒体平台上。事实上,并非所有关于贸易争端的微信文章都被审查:例如,一篇表明中日关系的改善可能为中美紧张关系的缓和创造积极条件的文章就没有被审查。在这种情况下,中国的外部冲突被提及,但用的是比较轻松的词语,有可能被缓解。当表明或暗示中国不一定是其他国家的 “朋友 “时,有关中国的外部冲突也会暴露出来,比如中国对国际援助不领情,是遏制行动的目标,或者正在利用其他国家(比如非洲国家)。

当然,冲突加剧的印象也可以通过批评传达给读者,这些批评要么表明国内经济问题,要么表明社会和政治特征,揭示了冲突管理的薄弱机构(Rodrik,1999),如高度腐败和低民主,表现在缺乏政治权利(如 “自由 “选举)和公民自由(如言论自由)(自由之家,2018a)。然而,与普遍认为支持或赞扬政府或其政策的 “正能量”(Yang,2018)受到政府欢迎不同,我们发现这种支持政府的文章在发出冲突信号时也会被审查。有几篇文章通过阐述 “中国制造2015 “和 “一带一路 “倡议等政策的影响来说明中国的实力和信心,或者将中国描述为与美国贸易争端中的强大 “斗士”,都遭到了审查。尽管这些文章确实传递了 “正能量”,但同时也披露了中国所面临的外部冲突。

焦点问题和在线审查制度:对调查结果的理解

那么,为什么具有较高特异性和/或信号冲突的文章会成为审查者的目标?托马斯-谢林的焦点概念可能是理解他们在审查机制中的作用的一种方式。和其他学者(Mehta, Starmer, & Sugden, 1994)涉及纯协调游戏的实验表明,当事先没有沟通时,人们在协调行为时使用具有显著性的焦点。例如,当人们被要求挑选一个最明显独特的正数时,数字 “1 “往往是最常见的选择;或者,在另一个例子中,当一群学生被要求选择在哪里与纽约市的一个陌生人见面时,中央车站的信息亭往往被选为该地点。通常选择的数字 “1 “和中央车站作为普遍选择的见面地点代表了 “每个人对另一个人期望他做什么的期望的焦点”(第57页)。在游戏中,一些策略的标签(如文字、图片、其他符号)比其他的更突出或显眼,通常是因为它们与玩家的常识、经验或文化有关(Mehta等人,1994)。有突出标签的策略更有可能被参与者选择,并有可能形成一个焦点。

在一项关于立法政治的研究中(Ringe,2005),焦点被定义为 “传达关于特定立法提案后果的信息的想法和形象”(Ringe,2005,第733页),与立法者的意识形态有关。焦点的提供被认为是一种中介,通过这种中介,意识形态可以与具体的政策建议联系起来,从而影响政策的偏好和结果。例如,在欧盟(EU)跨境收购法案的辩论中,在三个阅读阶段部署三个不同的主导焦点(即 “单一市场”、”工人权利 “和在欧盟范围内创造一个 “公平竞争环境 “的概念),有助于改变该法案的投票结果。与意识形态偏好和选区关切相关的焦点是 “决策捷径”(Ringe, 2005, p.738),它简化了立法提案,并使其更加具体化。焦点的概念也被用于理解对集体行动的先发制人的压制和对政治异见者的打击。学者们(Carter & Carter,2019;Truex,2019)认为,高调的事件(如支持民主运动的周年纪念日、高级别政权会议和国际体育赛事)可以作为活动家协调的自然焦点事件,因为这种 “异见者日历 “是提前知道的,具有高度的显著性,能够减少公民在试图形成集体行动时的协调问题;因此这些焦点事件也是国家压制的目标。

同样,互联网审查制度也可以被认为是一个多方博弈的环境,审查者打算对内容进行监管,而一些社交媒体用户则渴望规避审查制度,以便他们可以相互交流,例如促进公共讨论,形成对社会问题的意见,甚至动员社会行动。在这种内容监管机制中,审查员优先限制共同知识的分享,例如,删除社交媒体用户创建的媒体内容中的 “焦点”。在这种多方博弈的背景下,”焦点 “的作用也可以用阐释可能性模型(Petty & Cacioppo, 1986)的传播理论来理解,它提出了说服性传播的 “双重过程”:系统(理性)思考的路线或/和通过认知捷径的启发式思考路线。由于敏感话题或关键词在中国不允许直接发布,审查员和社交媒体用户都倾向于阅读超越字面意义的媒体文本,然后倾向于探索(社交)媒体内容中的 “隐藏意义 “或主动阅读 “字里行间”。换句话说,他们更依赖启发式思维而不是系统性思维。对于中国的一些社交媒体用户来说,虽然他们想表达的实际想法不能直接呈现,但作为一种规避审查的方式,他们会有目的地以提及 “焦点 “的方式来写作,以便为读者提供可能的线索,通过认知的捷径形成与原始想法相关的推论。对于审查者来说,文本或其他社交媒体内容中包含的这种线索可以被看作是启发式的,更有可能说服社交媒体的读者向不良的方向思考,例如,相信与可能导致社会不稳定的问题有关的信息。

从上面的经验性发现来看,标志着冲突的文本单元和提供细节和具体案例的具体术语,当它们被广泛分享并成为常识时,即启发式,将有可能促进感知危机的构建。冲突与稳定有摩擦(也就是说,这样的文本单元勾勒出一种 “形象”,即中国社会并不像政权所宣称的那样稳定),而具体的细节可以为公众提供证据,例如,关于政府的争议问题是一个谣言,一个错误的指控,还是一个不方便的事实。如果一个有争议的问题因为政府以外的个人或组织提供的详细信息而被认为是不方便的真相,那么信任危机就可能被成功构建。例如,一篇描述美国和中国之间贸易战升级的文章,通过提供被征收更高关税的商品的详细清单,有效地告诉公众,两国之间的紧张关系正在加剧,它还揭示了谁和什么将受到贸易战的负面影响。换句话说,这些信息可能有助于说服公众,危机正在或将要发生;因此,审查制度对成功说服的可能性作出反应,删除这些信息,以防止危机的构建,也就是说,防止人们相信他们正在或将要因危机而陷入困境。

因此,危机时期可以被认为是潜在焦点的一种类型–其显著性在于可能被唤起的对以往危机的(通常是负面的)共同记忆和经验。这种与以往危机相关的负面记忆和经验可以被看作是 “看不见的 “共享标签,因此更容易被公民认可。在其他选择中,危机时期可能更容易被社交媒体用户(如微信公众账号持有人或普通网民)选中,形成异议,要求改变,甚至动员集体行动,例如,解决他们的不满,因为他们会期望其他有这种共同负面经验的网民也这样做。因此,含有可能加入危机描写的元素的网上信息很可能被删除,作为对形成感知危机的预防措施,因为它可能预示着党国治理的问题。换句话说,这类元素可以作为启发式方法,使网民能够重新组合有关危机(焦点)的信息,并将其与原始想法(如批评政府或动员人民)联系起来。简而言之,审查员不仅压制原始想法,即焦点,而且还压制可能与焦点相关的 “材料”。

结论和局限性

通过选择2200多对内容相似但审查状态不同的微信公众号文章,我们发现,首先,有可能遭遇发布后审查的话题范围很广–它们并不局限于那些长期以来被认为是 “有问题 “的话题(如:色情和谣言),也不局限于以往研究中广泛涉及的政治问题等 “敏感 “话题。而在这组文章中,有超过四分之一的内容与经济有关,而这个话题在以前被认为是可以安全谈论的,即使在中国的审查制度下也是如此。尽管社交媒体上经济内容的数量可能部分归因于中国的经济放缓(Harada,2019),部分归因于本研究数据收集期间的中美贸易争端,但值得注意的是,中国的 “敏感 “话题以及中国的审查制度都是有背景的。

虽然这些被确定的话题在文章被系统实际删除的几率上没有太大差别,但正如研究结果所显示的,有一点确实提高了被审查的几率,那就是文章的特殊性。一般来说,在账户属性和文章主题得到控制的情况下,含有较多关键特定词汇的文章比含有较少此类词汇的文章更有可能被审查。此外,在研究有代表性的外贸文章时,我们发现许多被审查的文章至少有一个主要特点:它们包含有标志着中国必须处理的内部和外部冲突或紧张局势的文本单元。最后,根据上述发现,含有有助于构建焦点(如感知的危机)的元素(如特定术语和标志冲突的文本单元)的社会媒体内容似乎更有可能被审查者压制。

随着技术的发展和信息通信技术在中国的集中化,审查制度进一步发展,变得更加全面和复杂。就像为传统媒体报道设置议程一样,例如通过指导性指令进行审查(Tai,2014),威胁或惩罚批评或 “冒犯 “调查性记者和组织(Tong & Sparks,2009),网络公共领域的边界仍然由政权定义和限制,但拥有促进网络公共领域的商业社交媒体平台的力量。特别是,这种边界的划定是通过粗暴地警告媒体组织和意见领袖,也就是以内容违规为由删除他们发表的一些文章,而不明确指出任何法律来源。当关键的社交媒体用户创造或传播含有可能有助于认识、披露或构建潜在焦点的元素的在线信息时,这种边界的划定尤其如此。

本研究通过纵向监测数百个微信公众账号的日常发布活动,对中国一个主流社交媒体平台上的审查制度进行了严格的审查,研究设计是为项目目标定制的,没有依赖任何非透明的方法。此外,本研究为未来研究提出了一个理论概念,即焦点,以研究审查制度,或 “内容控制”(Roberts,2019),这已成为一种全球现象。然而,这项研究在所考虑的内容范围方面仍然是有限的,因为在分析中排除了文字以外的符号学单位(如图片、视频和其他符号)。由于WeChatscope系统也可以捕捉到微信公众号文章中的图片,因此,在考虑多模态符号单元时,审查模式是否以及如何不同,将是未来研究的一个起点。另外,尽管本研究提供了以前未被充分研究但极具影响力的社交媒体平台微信的互联网审查的新证据,但还需要更多具有坚实经验证据的自我审查研究。WeChatscope捕获的 “被内容所有者删除 “的微信公众号文章也可以作为自我审查的可能代理,这值得进一步研究。