数字与劳动
在此,我思考数字资本主义下的反抗以及劳动的经验诠释
谈及和超越审查制度:绘制中国推特领域的话题集群
  1. 谈及和超越审查制度:绘制中国推特领域的话题集群
    1. 摘要
    2. 中国的互联网审查制度和用户的观点
    3. 中国的 “推特圈 “作为一个另类的数字空间
    4. 方法和数据
    5. 發現
    6. 分享技术知识
    7. 表达政治观点
    8. 传播替代性新闻项目
    9. 结论和讨论

谈及和超越审查制度:绘制中国推特领域的话题集群

來源:Talking About and Beyond Censorship: Mapping Topic Clusters in the Chinese Twitter Sphere

摘要

作为一个在中国大陆被正式封锁的社交媒体平台,中国推特已经变成了一个替代性的跨国数字空间。通过替代空间的视角,本研究探讨了中国推特用户对互联网审查制度的看法和态度,以及中国推特作为一个替代数字空间是如何产生和维持的。我们应用LDA,确定了5个独特的主题集群来描述这个替代空间,其中包括三种类型的活动:分享技术知识、表达政治观点和传播替代新闻项目。用户在他们的讨论中使用了空间标记来区分中国推特领域和其他空间。为了维持中国推特作为一个另类的数字空间,分享技术知识和信息与政治反抗同样重要。虽然它是一个跨国的数字空间,但中国推特领域受到中国文化的影响,并利用了中国文化的优势。


作为中国互联网治理体系的一部分,中国长城(GFW)对内容进行监控、过滤和封锁,并阻止中国大陆网民正常访问被禁止的外国网站和应用程序,如Facebook、Twitter和Google。虽然近年来有许多实证研究探讨了中国互联网审查机制的结构和模式(Bamman, O’Connor, & Smith, 2012; King, Pan, & Roberts, 2014),但在中国网民如何体验和看待国家实施的审查制度方面,研究仍然相对匮乏。用户的视角对于彻底理解互联网审查制度的后果至关重要,因为它们通过展示普通用户在日常经历中如何看待和协商审查制度,对结构性视角进行了补充。之前的研究表明,中国网民依赖虚拟个人网络(VPN)等技术工具来访问全球互联网(例如,Mou, Wu, & Atkin, 2016)。此外,最近来自俄罗斯和土耳其等非民主背景的调查发现,对国家主导的互联网审查制度的支持程度出乎意料地高(Nisbet,2015;Yesil,2015),这表明用户对互联网审查制度的看法是多样化的,对社会背景也很敏感。

我们的探索性研究旨在通过考虑中国网民如何在Twitter上讨论互联网审查制度的问题,为这一研究方向做出贡献。自2009年下半年以来,Twitter在中国大陆被封锁,无法使用(Chen, 2014; Sullivan, 2012),导致它成为一个未经审查的空间,而不是以自我审查为特征。在中国的审查性互联网空间中,互联网审查制度不能被公开讨论。然而,在中国的推特上有很多讨论互联网审查制度的帖子,这些帖子可能更接近用户的真实想法。因此,本文通过调查用户在该背景下如何讨论与互联网审查有关的问题,探讨中国推特用户对互联网审查的看法和态度。此外,基于中国推特用户对互联网审查制度的讨论,本文探讨了中国推特是如何作为一个替代性数字空间产生和维持的。

我们将主题建模–一种无监督的机器学习算法–应用于关于互联网审查问题的中国推特样本,以研究这一替代空间的主题结构。我们确定了五个独特的主题集群,涵盖了三种类型的活动:分享技术知识、表达政治观点和传播替代性新闻项目。在每一个群组中,我们研究了构成讨论的关键结构。文章组织如下。首先,我们回顾了关于中国互联网审查制度的相关文献,并强调了互联网用户的经验和观点的重要性。接下来,我们解释了理论视角以及我们的方法和数据。接下来的章节对每一个群组进行了深入分析,文章最后对研究结果的广泛意义进行了思考。

中国的互联网审查制度和用户的观点

作为中国互联网最具争议性的问题之一,审查制度近年来引起了学术界的广泛关注。一些研究者通过调查不同网络平台的内容过滤模式,关注自上而下、由国家驱动的审查做法(Bamman等,2012;Esarey & Xiao,2008;Fu, Chan, & Chau,2013;MacKinnon,2009)。这些研究普遍发现,互联网审查的主要目的是压制对政府、政策和领导人的批评(Bamman等人,2012)。最近的研究还表明,与集体行动有关的信息更有可能被审查(King, Pan, & Roberts, 2013;King等人,2014)。此外,审查机制的技术架构出乎意料地分散,而且是分散的(Weaver, Sommer, & Paxson, 2009; Xu, Mao, & Halderman, 2011)。非国家行为者也发挥着协调作用(Hu, 2011; Jiang, 2012; MacKinnon, 2008, 2009; G. Yang, 2012b)。例如,社交媒体公司和互联网服务提供商等私营企业通过实行主动的自我审查来补充国家主导的监管制度(Jiang,2012;MacKinnon,2008)。他们在制定和实施自己的议程方面似乎享有一定的回旋余地(MacKinnon,2008,2009;Miller,2019),而且他们的审查做法有很大的差异,这取决于商业模式、企业文化和与政府的关系等因素(Jiang,2012;G. Yang,2012b)。Chu(2017)提出,经济保护主义可以成为解释中国互联网政策的另一个视角,国内互联网公司和平台的发展为审查制度提供了基础。

在中国大陆,用户选择以战略性和非公开的方式绕过审查制度,对互联网审查制度进行私人抵抗(G. Yang & Jiang,2015)。这种抵抗的例子包括用机器无法阅读的方式进行交流(Kou, Kow,& Gui, 2017),创造编码语言来表达政治敏感的意见(Xiao, 2011;F. Yang, 2016),参与在线政治讽刺(Esarey & Xiao, 2008;S. Y. Lee, 2016;Meng, 2011;Nordin & Richaud, 2014;G. Yang & Jiang, 2015),以及使用网络备忘录(Mina, 2014)。一些网民使用VPN绕过GFW,访问外国网站,抵制网络审查(MacKinnon,2011)。为了扩大GFW的规模,用户可能会寻求进行颠覆性的行为(Morozov,2011)。

尽管关于中国互联网审查的文献已经详细介绍了该机制的规律性、意图和技术架构,以及不同行为者的角色,但在某种程度上,一个重要的问题却被忽略了。中国网民在日常生活中是如何体验互联网审查制度的?如果不了解用户的生活经验,对互联网审查制度的社会后果的理解是不完整的。从用户的角度来看,对互联网审查制度的研究有两条主线。第一条显示,系统性的内容过滤会影响网民的动机和浏览行为。Mou等人(2016)的研究发现,规避工具的使用是由实用性而非意识形态动机驱动的。另一项研究发现,网民倾向于继续访问那些与他们所属的文化社区有语言和地理亲和力的网站(Taneja & Wu, 2014)。换句话说,文化亲和力塑造了中国网民的浏览偏好,就像其他国家的用户一样,相比之下,互联网审查制度的影响似乎并不明显。

第二条线索是考虑在非民主背景下公众对互联网审查制度的意见。例如,最近的一项研究发现,只有11%的俄罗斯人认为互联网应该完全不受任何形式的审查,54%的公众认为政府机构是最值得信赖的互联网监管机构,远远高于非政府实体(Nisbet,2015)。一项来自土耳其的类似研究发现,只有40%的土耳其公民认为互联网应该不受审查。支持程度因人们的互联网使用和政治派别而异(Yesil,2015)。从这些调查中可以看出,公众并不一致地反对互联网审查制度或政府作为互联网监管者的角色。尽管互联网使用情况等因素似乎是解释对审查制度支持程度变化的一个重要变量,但文化和社会背景也影响着人们对这一问题的态度(Asmolov,2015)。

这些发现表明,公众对互联网审查制度和政府干预的意见比预期的更加异质和取决于背景。他们强调了研究用户的观点和经验的重要性。由于缺乏来自中国的代表性调查数据,我们认为中国的推特领域,一个不受审查的数字空间,是一个理想的话语空间,以探索关于互联网审查问题的意见结构。因此,本文着重研究用户如何从他们在中国推特上的使用和体验中看待和讨论互联网审查制度。

中国的 “推特圈 “作为一个另类的数字空间

一个替代空间是独立于主流空间或其他空间的–例如,互联网与传统媒体相比(Gersch,1998;Meng,2011;Rahimi,2011)。至于Lievrouw(2011),”替代 “一词与 “积极分子”、”边缘 “和 “激进 “密切相关。因此,替代空间往往是抵抗空间。例如,跨文化翻译可以构成这样一个政治行动的替代空间(Baker,2013)。在实践中,替代空间在很大程度上强调了它们的差异。为了保持它们的差异性,替代空间呼吁建立一个 “替代想象的社区”(Meng, 2011, p.46),并采取一些技术和策略(Cao, 2017; Lievrouw, 2011)。

替代空间与公共领域(Habermas,1962)和反公共领域(Jackson & Foucault,2015)有关。然而,它们与反公共空间是不同的。反公共领域的概念强调对抗性话语以及主导公共领域与自身的关系,而替代空间的概念则侧重于差异而非对抗性话语。因此,我们在本文中采用了替代空间的概念。

由于没有审查制度,中国的推特成为一个特殊的案例,引起了研究者的关注。中国推特领域是一个什么样的空间?这个问题还没有得到明确的答案。一些研究者认为,中国推特是一个公共领域平台(Chen, Tu, & Zheng, 2017)。然而,也有研究者断言,中国推特不是一个自由的信息交流空间,因为一些机器人发布反中国国家的信息,以吸引世界各地的潜在用户(Bolsover & Howard, 2018)。

从使用的角度来看,中国推特是一个另类的数字空间。首先,中国推特是一个颠覆性的空间,通过连接不同的新闻来源和吸引一系列的活动家来讨论敏感问题(Benney, 2011; Ji, 2017; Sullivan, 2012)。在很大程度上,中国的推特是一个高度政治化的网络社区,这与新浪微博形成了鲜明的对比,新浪微博是推特的中国对应方,主要由娱乐、体育和广告等非政治性内容主导(Sullivan,2012)。其次,中文的Twitter社区代表了一个有意的 “国际空间”(Jiang, 2010),它可以在国内和国际上进行比较。

此外,中国的Twitter领域可以被认为是一个虚拟的边境地区。正如G.Yang(2012a)所观察到的,国家权力在数字空间的不同分布产生了虚拟边界区,在那里,国家法规已经变得淡化、分散和不那么具有指挥性。根据权力的类型和分配方式,虚拟边界区在中国互联网的背景下有各种形式。与政治网站相比,商业网站是虚拟边界区的一个案例,因为它们较少受到国家的直接监管权力的影响,这使它们有更大的谈判筹码。同样,相对于国有或商业在线新闻门户网站,在线自媒体也是虚拟边界区。相对来说,来自审查制度和利润的压力较小,使他们有更大的自由来设计自己的议程。

至于中国的推特,由于GFW的存在,用户从中国大陆访问推特并没有得到保证。从中国大陆访问推特需要了解规避技术。同时,虚拟边界区的模糊性也意味着国家权力的指挥性降低,这就为越轨行为创造了机会。因此,推特也可以作为一个被禁止的虚拟边界区的案例,来研究数字空间中国家权力和公民行动主义之间的动态关系。

据我们所知,很少有文献从用户的角度讨论中国的推特空间是如何产生和维持的。一些研究从政治抵抗的角度进行了解释(如G. Yang, 2012a),而其他因素则被忽略了。本研究提出了以下问题。从用户对互联网审查制度的讨论来看,中国的推特是如何作为一个替代性数字空间产生和维持的?

方法和数据

主题建模是一系列探索性的机器学习算法,旨在从大量的文档语料库中发掘出隐藏的主题结构。在这项研究中,我们使用了一种无监督的主题模型,即潜在狄里切特分配(LDA;Blei, Ng, & Jordan, 2003)。LDA假设一个文本文件可以被表示为一个独特的话题分布,这些话题一起出现的频率比预期的要高。同样地,每个主题都可以用一个独特的词的分布来表示。有了文档样本,这种方法可以让我们估计这两个分布,并生成一组可解释的主题。有了这些信息,研究人员就能够检查任何给定文件中的主题分布。他们还可以通过研究最流行的术语来确定描述每个主题的概念构件。

LDA最初是由计算机科学家开发的,用于促进大型文本语料的自动分类。DiMaggio、Nag和Blei(2013)强调了 “话题”–经验性的术语集群–与社会科学家通常用来研究文本数据的一套概念工具之间的亲和力。特别是,他们建议,一个话题集群可以被解释为一个文化框架,即 “一组话语线索(词语、图像、叙述),暗示着一个人、事件、组织、实践、条件或情况的特定关联”(DiMaggio等人,2013,第593页)。作为一种意义生成的装置,框架将不同的符号组合在一起,并使它们连贯起来。这种方法对于揭示文本数据中隐藏的主题非常有用,尤其是当数据量大到无法进行手工编码的时候。LDA已经被应用于各种文本数据的分析,如新闻文章(DiMaggio等人,2013)和摘要(Kaplan & Vakili,2015)。最近,LDA也被用于探索大量相对较短的文本中的隐藏结构,比如推文(Hong & Davison, 2010; Ramage, Dumais, & Liebling, 2010; Weng, Lim, Jiang, & He, 2010)。

在本研究的背景下,我们认为话题集群是可以讨论互联网审查制度的概念框架。每个群组的特定词汇和短语是构成特定框架的关键构造的话语线索。为了确定与审查制度有关的推文语料库,我们使用了相关术语和标签的组合,包括 “防火墙”(”防火墙”)、”翻墙”(”翻墙。 “一个绕过GFW的流行委婉说法)、”科学上网”(另一个绕过GFW的流行委婉说法)、”#fuckGFW “和 “#greatfirewall。 “ 通过这些搜索词,我们随机选择了2015年9月1日(2015年7月1日至2015年12月31日之间)这一天,共检索到162,720条推文。然后我们删除了非中文的推文以及那些没有被转发的推文,以 重点关注在语料库中相对更有影响力的推文子群。经过清理程序后,样本中剩余的推文总数为30,896条。接下来,我们删除了与我们的研究问题不相关的文本特征,包括表情符号、数字、日期、标签和提及。我们还删除了重复的推文,以避免有偏见的词频估计。最后,本研究的样本包含6,432条推文。

接下来,我们使用textmineR软件包(3.0.3版)来进行LDA分析。我们对样本进行了LDA模型的拟合。由于推文很短,而且大多数只包含一个主题,我们选择了概率值最大的主题。值得注意的是,研究者必须在运行模型之前确定话题的数量。然而,这个先决条件并不意味着模型选择是一个任意的程序。特别是在对不同的模型进行决策时,可解释性和分析效用构成了最关键的考虑因素(DiMaggio等人,2013)。此外,对上下文的熟悉程度和特定领域的知识也很重要,因为它们补充了话题建模提供的启发式镜头(Grimmer & Stewart, 2013)。在对推文语料库进行模型拟合时,我们尝试了不同的解决方案,话题数量从2到12不等。我们用不同的模型参数多次运行每个模型,以检查其稳健性。两位作者分别独立地标记了聚类,然后我们召开会议比较结果,并通过讨论解决分歧。我们带着以下问题仔细比较和评估了每个解决方案。(1) 由模型解决方案产生的词簇的可解释性如何?(2) 从一个主题群中得出的主题解释是否与推文的实际内容产生共鸣?(3) 一个解决方案在可解释性和简洁性之间有多大的平衡?经过这个过程,我们确定了一个五主题的解决方案,它提供了合理程度的可解释性和稳健性。

發現

我们的第一个研究问题与中国推特领域的结构有关。由于一些推文可能包含一个以上的主题,我们认为一个推文如果有超过50%的词被分配到某一主题上,就是该主题的典型案例。表1显示了五个主题集群在典型推文中的分布。

如图1所示,”技术知识共享 “这一主题群是最普遍的,在28%的推文中出现。接下来的三个,”一般审查制度”、”互联网审查制度 “和 “杂项新闻来源 “在分享方面相似,各占典型推文的大约15%。为了便于分析,我们根据内容的性质对这些主题群进一步分组。第一个集群中最常见的推文是信息性的;第二和第三集群的特点是个人意见和表达;最后两个集群主要由带有简短的新闻标题和外部网站链接的新闻项目组成。

对于每一个聚类,我们根据相关性的衡量标准对30个最有特色的术语进行排名(Blei等人,2003)。这些术语之所以重要,是因为它们构成了特定主题群的基本概念构件。同时,我们还仔细阅读了最典型的推文,具体来说,就是那些90%以上的词汇被分配到同一主题的推文。

分享技术知识

我们给第一个话题组贴上 “技术知识分享 “的标签,因为这个话题组中的大部分推文都是事实,尤其是关于规避技术的知识。与网络有关的技术术语见表1。

一些词语指的是经常绕过GFW的网民中广泛使用的规避工具,如”Shadowsocks”(一种开源规避工具)、”SS”(一种流行的规避客户端)、”Surge”(一种流行的规避工具)和 “VPN”。另一组流行词与互联网或计算机特定术语有关,包括 “服务器”、”系统”、”iOS”、”IP”、”网络流量 “和 “路由器”。

正如这些术语所表明的那样,这一集群的一个流行主题是交流与规避有关的技术知识和信息。例如,在下面的例子中,作者报告了他对GFW的拦截模式的个人观察,并分享了关于如何相应优化规避工具性能的提示。有关技术使用的知识和智慧被分享,这有助于建立中国推特社区的认同。

对于用户来说,审查制度是一个具体的障碍,而不是一个抽象的障碍或简单的比喻。诸如此类的推文是有作用的,因为互联网审查制度会随着各种因素的变化而定期改变,比如技术基础设施的更新和重大社会事件的爆发(Bamman等人,2012;Fu等人,2013)。例如,在2015年初,中国政府加强了对国内VPN服务的控制,导致通过中国大陆的VPN与被屏蔽的网站频繁断开连接(Russell, 2015)。这个集群中的推文起到了实时晴雨表的作用,提供了关于GFW审查行为的最新情况,这使得用户能够在现有的技术选择中做出明智的选择,并与全球互联网保持联系。这一发现与强调社交媒体在网络社会运动中作为信息库的作用的文献一致(Bennett, Breunig, & Givens, 2008; Vasi, 2006)。

为了更好地理解积极参与技术知识分享的用户的动机和行为,我们考虑了一种被称为 “替代性计算 “的数字行动主义形式,其中具有技术专长的活动家 “设计、建造和’黑客’或重新配置系统,目的是抵制政治、商业和国家对公开获取信息和使用信息技术的限制”(Lievrouw, 2011, p.98)。此外,替代计算正在成为 “新媒体行动主义的一个流派”(Lievrouw, 2011, p.117)。它与其他形式的在线活动主义的不同之处在于 “对信息获取的共同伦理和政治承诺”(Lievrouw, 2011, p.99),这被认为是解放政治的一个关键前提条件。正如G. Yang(2006)所强调的,信息获取和信息技术是中国数字领域政治斗争的核心利害关系和舞台。从这个角度来看,能够实现全球互联网接入的技术工具和知识不仅是逃避审查的实用解决方案,也是挑战GFW基础意识形态的政治声明。

从技术及其使用的角度来看,审查制度和反审查制度之间存在着一种动态的互动。一方面,GFW继续更新和改进其过滤能力。另一方面,为了确保对全球互联网的持续访问,中国网民必须了解变化,创新有效的反制策略,并在中国的推特领域传播这些知识。中国推特用户的跳墙行为促进了反审查制度的斗争和审查制度本身的演变,这是一个 “相互促进 “的过程。然而,这也是令人担忧的,因为新来者面对的是已经升高的审查制度。

表达政治观点

第二和第三主题群中涉及 “互联网审查 “和 “一般审查 “的推文,主要是对国家审查做法的个人意见和评论。关于 “互联网审查 “的讨论特别关注网络空间的审查做法。几个排名靠前的词包括特定的社交媒体平台,如 “微博”、”推特”、”微信”、”微博好友”、”推特”、”账号 “和 “朋友圈”(见表2),这表明社交媒体作为数字背景在中国网民的网络审查生活经历中的突出地位。

这个群组中最常见的话题之一是流行的社交媒体平台在没有事先通知的情况下突然删除文字内容,如评论、新闻条目和文章。例如,下面这位网友讲述了阅兵期间新浪微博上的新帖被删除的案例。

贯穿这些例子的一个共同线索是基于互联网审查制度的存在与否的数字空间的分区形象。这条主线是通过使用定义边界的空间标记来表明的。在例3中,”外面的世界 “指的是不受审查的数字空间,这表明GFW被认为是一种技术基础设施,它以类似于物理墙的方式分隔了数字空间。

在这里,空间标记根据互联网审查制度的存在与否,定性地划分了不同的空间。这两种信息生态被认为具有截然不同的意义:不受审查的空间意味着思想开放,渴望拥抱多样性;而受审查的空间则创造了一种信息封闭,成为年轻一代中民族主义和地方主义的催化剂。此外,如表2所示,有几个空间标记在这个群组中最受欢迎的词汇中排名靠前,包括 “墙内”、”东/西”、”国内 “和 “肉体”(指此人在中国大陆以外的地方,这就否定了规避的必要性),表明一个被分割的数字空间的形象占了上风,并影响了关于互联网审查的讨论。

规避GFW意味着比更广泛的信息获取,它被认为是一种特权,应该被珍惜和谨慎使用。在例4中,作者对比了GFW内部和外部的媒体景观。同样,作者在提到墙的时候,也是把它当作一个分割空间的物理结构。此外,GFW的攀比者有时在文化意义上有更多的道德优越感,这在中国互联网上区分了不同的阶层。

在第三个话题组 “一般审查 “中,”审查 “一词仍然是必不可少的。然而,它的范围已经扩大到包括各个领域的审查做法,如电影制作、图书出版和新闻业。国家经常被提到要对这些审查行为负责,因为几个流行的术语都指向国家机器和政治基础设施,如 “当局”、”国家”、”中国政府 “和 “系统”(见表3)。

例如,例5讲述了诺贝尔奖获得者高行健的故事,由于中国大陆对出版的严格审查,他无法发表自己的作品。

有趣的是,空间标记在这个群组的最相关术语中也排名靠前(见表3)。然而,与前一个群组不同的是,他们不再根据互联网审查制度来划分空间,而是根据社会和政治制度的类型来划分。有一些国家或地区,如 “中国”、”大陆 “和 “朝鲜”,媒体受到国家的密集管制。同时,也有诸如 “美国”、”外国 “和 “香港 “这样的例子,言论自由受到高度重视并受到法律保护。可以理解的是,这一组的一个流行主题是在民主和非民主背景下的审查做法的比较中发现的。例如,例6提到了一份关于媒体审查制度最广泛的国家的研究报告,其中包括中国。

互联网审查 “和 “一般审查 “群组包含了最具政治动机的讨论。它们展示了被禁止的虚拟边界区域的授权潜力,例如中国的推特领域,在那里,有政治动机的网民能够讨论、辩论和审议与审查制度有关的问题。这对构建中国推特社区的身份是有帮助的。然而,这种现象并不意味着国家的影响已经完全消失了。根据Mann(1984)的说法,国家权力的一个重要来源源于其创造和维持地理边界的能力。如果领土化是国家权力运作的一个决定性特征和表现,我们可以把GFW这样的人工信息屏障看作是国家划界技术在网络空间运作的一个实例。这些技术受到了网民的抵制,要么是以规避技术的形式,要么是在Twitter上的批评。然而,空间标记的存在表明,人们普遍认为像GFW这样的技术基础设施以类似于物理边界的方式创造和维持国家边界,从而促成了关于互联网的分割形象。

对中国推特上这些讨论的进一步分析显示了中国语言和文化的影响。由于其140字的限制,Twitter可能不是深入讨论和谈论政治的最佳途径。推特的功能更多的是作为认可,而不是作为思想的阐释。然而,中国的推特领域代表了一个有点不同的情况。虽然一个汉字和一个拉丁字母所占的空间相同,但前者往往信息量更大(Benney,2011)。例如,英语单词 “good-bye “由七个字符组成,而它的中文对应物(”再见”)只包含两个。汉字在默认编码方案中的相对效率,加上没有国家施加的审查制度,使得Twitter成为深入政治讨论的有力交流工具。

传播替代性新闻项目

前面三个集群主要由原创推文组成,而最后两个主题集群往往包含新闻标题。许多包含了引导读者到外部网站的URL。如表4所示,第一个新闻集群的中心主题是法律问题和执法,其特点是出现了一些法律术语,如 “律师”、”法律”、”检察官”、”案件”、”有罪”、”犯罪 “和 “控告”。此外,其他流行的词语指的是国家机构,包括 “警察”、”国家 “和 “政府”。

在最典型的推文中,涉及国家官员的法律活动成为一个反复出现的话题。有两大主题特别值得注意。第一个主题涉及人权活动家和国家之间的法律冲突。例如,有几条推文提到浦志强,一个被指控获取公民个人信息并被国家法院判处监禁的人权活动家。第二个主题关注国家或地方政府的法律行为,比如对涉嫌腐败的高调政府官员的调查,这很可能会被审查。例如,例7来自一个自称是人权活动家的用户。

我们给最后一个群组贴上 “杂项新闻来源 “的标签,因为这些推文的主要特点是具有共同的文本特征,表明了新闻来源而不是一个连贯的主题(见表5)。例如,诸如 “共产党”、”时代”、”大陆”、”必看 “和 “退出 “等词汇构成了简短的口头禅,可作为来源的标识。

与 “法律/执法 “集群类似,这些新闻项目往往包含可能引发审查的敏感内容,因此不太可能在中国互联网上广泛传播。例子8涉及另一个与共产党高层领导之间的政治竞争有关的敏感话题。

如何理解另类新闻在中国微博领域的盛行?中国国内的媒体系统往往与国家的议程紧密结合,不容忍对国家的合法性构成挑战的新闻或信息。然而,像推特这样的虚拟边界区域,以有利于社会活动的国际政治机会结构,破坏了这种权力不对称(G. Yang, 2012a)。当然,也许还有另一个基本的技术前提条件:没有审查制度。这种独特的机会结构加在一起,使得替代性媒体能够蓬勃发展,并接触到愿意接受此类信息的潜在Twitter受众。受众可能包括经常规避GFW以获得更多不同数字媒体饮食的中国网民(Mou等人,2016;Q. Yang & Liu,2014),以及对中国活动家的声音感兴趣的全球媒体专业人士(G. Yang,2012a)。然而,GFW限制了活动人士接触中国大陆相当一部分目标受众的能力,这使得中国推特领域面临被边缘化的风险。

结论和讨论

在这项研究中,我们将话题模型(LDA)应用于以互联网审查问题为中心的中国推文样本,以分析话语空间中的主题结构。五个独特的主题群横跨三个主要活动:分享技术知识、表达政治观点和传播替代性新闻项目。基于用户对互联网审查制度的讨论和五个主题集群,本文发现了中国推特领域作为一个替代性数字空间的形成和维持机制。首先,分享和获得最新的技术知识和信息可以使用户继续绕过技术封锁,如GFW。中国大陆的用户继续访问推特,是中国推特形成和维持的前提条件。其次,对敏感话题和内容的讨论是重要的维护机制,反映了中国推特是如何成为抗议和抵抗的另类数字空间的。敏感话题和内容符合中国推特用户的期望,包括活动家和那些对获得未经审查的信息感兴趣的用户。同时,它将中国推特与中国大陆的互联网空间区分开来,并保持中国推特社区的身份。为了突出中国推特是一个另类的数字空间,用户在讨论中采用了许多空间标记来划定边界,这抵制了中国政府与GFW划定边界的努力。第三,传播另类新闻以吸引潜在受众和国际媒体,可以帮助中国推特获得政治机会。关于中国推特领域的形成和维持,G. Yang(2012a)和其他关注政治阻力的人一样,关注敏感话题和政治机会(Sullivan,2012),但在一定程度上忽略了技术的重要性。当中国推特作为一个替代空间被讨论时,不仅要注意政治和赋权,也要注意技术。

虽然它是一个跨国的、另类的数字空间,但中国的推特空间受到中国文化的影响,并利用了中国文化的优势。例如,在140字的推文限制内,中国推特空间利用汉字来传达更丰富、更多样的意义。在这个意义上,中国的推特空间是具有文化敏感性的。正如Y. O. Lee(2009)所指出的,互联网的使用及其影响往往是针对具体内容的,而不是普遍的。这一发现提醒我们要关注跨国替代空间中的文化因素。

这种文化敏感性也反映在对 “跳墙 “或 “翻越GFW “的看法上。在中国的语境中,墙是 “用石头和砖头组成的建筑,用来撑起屋顶或将内部与外部隔开”(Liu, 2009, p.461)。一些学者质疑 “防火长城 “作为研究中国互联网审查制度和其他非民主背景下类似监管做法的隐喻的经验准确性和分析效用。Hamdy和Gomaa(2012)强调了这一术语所暗示的简化描述(阻止来自 “外部 “的信息)与互联网审查制度在现实中如何运作之间的差异。Tsui(2007)强调了这个词的意识形态内涵,以及它是西方国家外交政策运动的组成部分的方式。然而,那些主张这一隐喻的优点的人认为,作为对互联网治理现状的批判性反思,它仍然有效。例如,李(2016)认为,”‘墙’的存在,既是一种技术设备,也是一种结构性隐喻,是全球媒体网络的一个征兆性对象,打破了无边界全球访问的神话,突出了民族国家的监管权力”(第110页)。我们的研究表明,GFW不仅仅是一个简单的隐喻:它影响了中国网民想象、体验和讨论互联网审查的方式,因此它是用户生活经验的一个组成部分。从这个角度来看,尽管GFW不足以全面描述审查制度的运作方式,但它作为一个概念性工具,对分析互联网审查制度对用户的影响仍然很有用。换句话说,结合中国的背景和中国的文化,翻墙使GFW更有意义和存在感(李,2016),同时,它使权力斗争变得明显。这种现象是用户的视角,有助于丰富对互联网审查制度的影响的理解。

我们提出了国家的互联网监管制度和中国网民的反抗之间的动态互动。未经审查的中国推特领域为各种形式的网络反抗GFW提供了独特的机会。同时,国家的权力虽然在推特领域有所淡化,不那么有号召力,但仍然通过GFW体现其影响。这种不断发展的审查机制要求用户相应地更新抵抗的技术手段;GFW通过在网民的头脑中培养一个被分割的数字空间的形象,将线下的主权边界投射到数字领域;GFW还通过限制替代性新闻来源在国内受众中的渗透来控制虚拟边界,从而加强了中国媒体机构和社会活动家之间的权力不对称。我们的研究揭示了发生在虚拟边界区域的权力执行和越轨的共生关系,比如中国的微博领域。在某种程度上,越轨行为本身也证明了国家划界技术力量的减弱和持续存在。

我们的研究证明了探索性的计算方法,如LDA,在调查和理解大型文本语料的模式和规律性方面的潜力。当很难根据数据制定预设的假设,或者由于数据集的大小,手工编码不实用时,这种方法就特别有用。在我们的研究中,LDA有效地降低了话语体的复杂性,并揭示了出乎意料但具有理论意义的模式。此外,最近的努力已经开始探索话题模型的经验发现和社会科学中成熟的理论概念之间的联系(例如,DiMaggio等人,2013)。这一探索路线可能会让研究人员从模型输出中产生有理论依据的解释,并通过经验上的严格方法推进当前关于网络社区文化的知识。