数字与劳动
在此,我思考数字资本主义下的反抗以及劳动的经验诠释
互聯網防火墙真的隔离了中国人吗?将访问封锁与文化因素相结合来解释网络用户的行为
  1. 互聯網防火墙真的隔离了中国人吗?
    1. 摘要
    2. 中国的互联网审查制度和互联网
    3. “信息的自由流动”、访问封锁和用户的偏好
    4. 全球互联网的使用和文化上的市场
    5. 互联网接入阻塞和用户行为
    6. 数据、措施和方法
      1. 受众重复性
      2. 数据:comScore
      3. 方法
    7. 分析和结果
      1. 分析全球在线受众的流动情况
      2. 识别文化定义的市场(CDMs)
      3. 文化定义的市场的相对孤立性
      4. 作为WWW上的中国CDM的C- Cluster
    8. 讨论

互聯網防火墙真的隔离了中国人吗?

來源:Does the Great Firewall Really Isolate the Chinese? Integrating Access Blockage With Cultural Factors to Explain Web User Behavior

摘要

对互联网审查制度的主流理解认为,阻止对外国网站的访问会形成孤立的互联网用户群体。我们对这一论述提出质疑,因为它假设如果获得访问权,人们会使用所有的网站。我们建立了一个概念框架,将访问封锁与社会结构结合起来,以解释网络用户的选择,并认为用户会访问他们认为文化上接近的网站,只有当这些网站被封锁时,访问封锁才是重要的。我们研究了中国的情况,那里的网络封锁是出了名的全面,并将中国的网络使用模式与其他地方的网络使用模式进行比较。通过分析1000个访问量最大的网站中的受众流量,我们发现网站根据语言和地理环境而聚集。中文网站构成了一个集群,它在构成和隔离程度上都与其他此类地理语言集群相似。我们的社会学调查显示,在解释在线行为时,文化的接近性比访问的阻隔性作用更大。


美国国务卿希拉里-克林顿在出席纪念柏林墙倒塌的庆祝活动2个月后,在其关于 “互联网自由 “的演讲中宣布:”一个新的信息帷幕正在世界大部分地区降下”(克林顿,引自Cramer 2013, 1077)。她的发言说明了一种普遍的理解,即国家封锁在万维网上创造了孤立的社区。这种说法是基于这样一个假设,即互联网用户如果获得访问权,就会使用所有网站。相反,大量关于全球文化消费的研究表明,受众更喜欢与他们的文化更接近的产品,即使他们可以使用来自国外的产品。在这篇文章中,我们借鉴了这一矛盾,并主张建立一个框架,将访问封锁与其他社会结构,如语言和地理相结合,以解释网络用户的选择。这个框架将在线国家审查制度视为一种文化保护主义的形式。

为了检验这个概念框架,我们把重点放在中国,因为中国的互联网审查制度最发达,而且在国际上引起了极大的关注。我们研究了全球的网络使用模式,将中国的网络使用与其他没有受到国家封锁的地区进行比较。首先,我们分析了全球1000个访问量最大的网站的流量,并发现网站根据地理和语言聚集在许多文化定义的市场中。中国的集群就是这样一个市场,而且我们发现,与其他在 “开放 “的互联网上形成的地理语言集群相比,它并不是特别孤立的。此外,我们研究了中国文化定义市场的具体构成,发现封锁是对它的一个相当有限的解释。最后,我们推测,如果中国的长城防火墙被解除,中国网民的行为会发生什么变化。

中国的互联网审查制度和互联网

1994年,通过美国Sprint公司提供的64K国际专用线路,中国首次实现了与万维网的全功能连接。中国政府于2000年开始对在线内容和服务进行监管,当时互联网的使用还仅限于研究机构、国家机关和外国公司的精英阶层(普及率低于2%)。在加强对这种新媒体的意识形态控制的同时,国家也在扩大互联网基础设施和信息经济方面发挥了积极的作用(Harwit and Clark 2001;Zhang 2006)。经历了指数级的增长,截至2012年底,中国在线人口规模已达5.64亿,国内网站数量达268万(CNNIC nd)。这些因素的结合导致中国拥有所有国家中最多的在线人口,庞大而繁荣的国内互联网产业,以及技术上最先进的互联网审查制度。

国家审查员对他们认为违反社会和道德规范(如色情内容;见Jacobs 2012)或威胁统治者的所有类型的网站采取行动(Faris and Villeneuve 2008;Bamman, Brendan, and Smith 2012)。审查并不局限于新闻和政治网站,因为非民主政权的用户往往会以具有政治意义的方式参与到看似 “非政治 “的领域。例如,在中国的个人博客圈、社交媒体和视频分享网站,用户发展出独特的风格来表达政治讽刺,并作为娱乐内容的衍生品发起公民讨论。他们还利用通过网上休闲活动建立和维护的社会网络来动员政治抗议,这使得任何具有网络功能的网站都有可能成为审查的目标(MacKinnon 2008;Marolt 2011;Meng 2011;Xiao 2011;Yang 2009)。

中国的互联网审查包括两类措施:对国内网站的内容审查,以及针对国家管辖范围以外的网站的访问封锁。关于第一种措施,即内容审查,需要注意的是,国内的网络环境在意识形态和信息方面根本不是单一的。为了应对网上内容生产的巨大规模,国家越来越多地依靠私营企业来监控自己的地盘,导致国内的信息制度在很大程度上是分散的、异质的纪律(MacKinnon 2009)。刚才讨论的复杂的动态和活跃的用户活动都来自于这种制度安排;虽然审查员监视着广泛的在线场所,但用户在绕过雷达方面很有创造力。此外,国家积极培养一个更自由的领域,人们可以在这里发泄不满,享受乐趣,国家也可以在这里观察公众意见,调整地方政策(Hassid 2012; MacKinnon 2011; Zheng 2007)。最近的一项研究表明,微博的审查者主要是删除那些 “代表、加强和刺激社会动员 “的评论,但更有可能允许对政府表达不满(King, Pan, and Roberts 2013)。

尽管所有这些围绕国内网络空间的内容审查的持续争论,公众的注意力明显集中在国家审查的第二个措施上,即访问封锁,这也是我们本研究的重点。这种巨大的过滤机制最早是在国外提出的,现在被广泛称为 “中国的长城”,或GFW(Barmé和Ye 1997)。GFW允许监管机构通过层层技术干预,阻止中国的互联网用户访问目标外国网站(Feng和Guo 2013)。

“信息的自由流动”、访问封锁和用户的偏好

在美国关于国际传播的政策论述中,GFW往往被等同于数字版的铁幕,它遏制了 “信息的自由流动”(Cannici 2009;Tsui 2008)。例如,正如开篇所引用的,希拉里-克林顿告诫说,要防止 “新的信息幕布 “在全球互联网上形成一个重要的 “隔断”(克林顿,引自MacKinnon 2011, 32)。诸如 “Chinternet “这样的术语,自2010年谷歌因审查争议退出中国以来广泛传播,清楚地传达了中国互联网是一个不同于万维网(WWW)的实体的看法,因为它被一个镇压性的政权所包围(Chao and Worthen 2010; also see Mueller 2011)。

这些政策和流行的论述往往假定,GFW阻止中国人加入世界,接受自由和民主的价值观,并在此后推动民主化(Damm 2007;Tsui 2008)。与这种信念相同,学术研究详细记录了中国人如何为突破GFW而奋斗(Harwit and Clark 2001; Mulvenon and Chase, 2005; Xiao 2011)。这种理解中包含了对中国用户互联网浏览选择的假设,即如果他们可以自由地访问他们想要的东西,他们会选择哪些网站。换句话说,GFW被认为是阻止中国人访问外国网站。

与用来描述中国互联网过滤的冷战隐喻相呼应,一项关于共产主义的崩溃如何影响东欧国际思想流动的研究尤为重要。通过测量崩溃前后的书籍翻译,它指出,现有的强调国家审查制度来解释西方信息的低流入,掩盖了受众偏好所发挥的作用(Abramitzky和Sin 2010)。在这种情况下,GFW在多大程度上损害了中国网民的信息检索的积极性?

在全球互联网用户调查中(互联网协会2012),与其他19个国家的个人相比,中国人在对互联网控制相关问题的看法上并不例外;而且,他们倾向于认为政府对互联网的监管会带来更多的积极后果。事实上,各种调查发现,在中国,对互联网审查制度的容忍度相对较高(Guo and Feng 2011;Li 2009)。虽然对审查制度的认可可能是由某些文化和历史因素造成的,但89%的中国网民(全球平均水平:85%)同意或强烈同意他们 “可以充分获取互联网上的所有信息”(互联网协会2012,20)这一事实表明,GFW对互联网使用模式的强制性影响被高估了。正如一些人种学研究表明,许多中国人要么不知道GFW,要么不关心它(Damm 2007, 282-85; F. Liu 2010)。因此,访问封锁在多大程度上缓和了中国人在互联网上颁布其偏好的能力,需要大规模的实证调查,尤其是当越来越多的媒体产品在全球范围内变得越来越容易获得时。

除了对用户偏好的假设,我们还对全球互联网治理中对国家封锁的迷恋持怀疑态度,因为我们认为它源于冷战时期发起的 “自由流动理论 “的意识形态基础(Nordenstreng 2011; Tsui 2008)。最近的批判性调查指出了这种话语的一个有问题的假设–只有政治统治才会阻碍信息的自由获取。在正式的民主国家盛行的经济利益也在起作用(Cramer 2013)。

同样地,我们认为像GFW这样的国家强行封锁是对人们自由的侵犯,而不管是否发生了强制性的预防。互联网治理应该是人民民主决策的结果,而不是专制政府的任意权力。从根本上说,我们所反对的是中国用户通过GFW的运作所标示的政治服从条件,而不是它对人们的浏览行为可能产生的具体干预类型(见Skinner 1988)。

在下一节中,我们回顾了关于全球媒体消费的相关文献,并假设访问封锁如何与其他文化因素相结合,以解释中国的网络使用模式与全球的网络使用模式。

全球互联网的使用和文化上的市场

万维网被认为是一种固有的全球大众媒体。任何能够使用互联网设备的用户都有可能访问万维网,而不管该用户身在何处。因此,任何限制访问万维网内容的尝试都被视为阻止用户访问信息。这种说法假定人们对WWW上的所有内容都有同样的倾向性。现有的经验研究表明情况并非如此。

例如,Barnett、Chung和Park(2011)在分析网站之间的国家间超链接结构时发现,使用相同语言的网站或专注于同一国家的网站往往比使用不同语言或专注于其他国家的网站有更多的相互间的超链接。在对维基百科的大规模分析中,Hecht和Gergle(2010)发现,每一种语言的维基百科在其涵盖的概念以及涵盖的共同概念的内容上都与其他的维基百科不同。同样地,当人们在地理上接近时,当他们使用相同的语言时,或者当他们的位置之间有直接的航空连接时,Twitter的联系就会形成(Takhteyev, Gruzd, and Wellman 2012)。这些发现表明网络用户倾向于表现出对本地内容的倾向性。

事实上,不仅仅是网络用户,各种媒体的受众都对本地产品有偏好。一般来说,人们更喜欢用自己的语言表达的内容,喜欢和朋友讨论这些内容,并且认为从本地产品中获得的意义比从外国产品中获得的意义更容易(Pool 1977)。受众喜欢更接近他们文化的内容的这种趋势被称为文化接近性。当全球媒体消费总体上表现为许多文化定义的市场(以下简称CDMs)时,我们可以看到文化接近性的作用(Straubhaar 2007)。每个CDM都是一个媒体市场,其内容和受众具有共同的文化特征,如共同的语言和地理上的接近。

语言是文化定义市场形成的最明显的解释之一(Straubhaar 2003),部分原因是全球大量的受众主要以他们理解的语言消费内容。这种区域性或跨国性市场的例子包括中美洲和南美洲的西班牙语国家、中国大陆和香港、讲印度语/乌尔都语的(北方)印度和巴基斯坦,以及大部分讲阿拉伯语的中东地区(Curtin 2003; Straubhaar 2007)。瑞士境内的不同语言区(德语、法语和意大利语),印度境内的不同语言区(泰米尔语、泰卢固语等),以及美国境内讲西班牙语的西班牙裔受众(Ksiazek和Webster,2008)都是民族国家内此类市场的例子。在其他情况下,CDM在地理上并不相邻,例如,葡萄牙语世界(巴西、葡萄牙、莫桑比克和其他国家)或英语世界(美国、加拿大、英国、澳大利亚、新西兰和其他国家)。

除语言外,关于文化接近性的文献还指出,媒体内容的生产地和受众之间的地理接近性也是一个因素。由于世界各地的受众都能获得丰富的国家和地区内容,研究表明,在印度(Neyazi 2010)和韩国(Jin 2007)等亚洲国家,在巴西和厄瓜多尔等拉丁美洲国家(Davis 2003),以及黎巴嫩等中东国家(Kraidy 1999),都存在文化接近性。并非所有国家都有足够的市场规模和/或财富来制作大量的国家节目。在这种情况下,文化接近的理论认为,观众会倾向于附近地区的内容(Straubhaar 2007)。

虽然语言和地理通常是相关的,因为地理上相邻的地区往往使用相同的语言,但当这些地区没有共同的语言时也会形成CDM。例如,宝莱坞电影在阿富汗和阿拉伯世界的大部分地区相当流行,尽管印地语(大多数宝莱坞电影的语言)在这些国家既不说也不懂。另一个例子是由西班牙和葡萄牙组成的伊比利亚半岛。在这种情况下,这些领土有着共同的种族群体迁移、殖民主义和文化接触的历史(由于地理上的接近、贸易等)(Straubhaar 2007)。

许多国家实行的文化保护主义政策支持了CDMs的发展,以保护民族文化不受外国影响。这种政策主要包括两种做法。首先,许多国家对外国内容的进口实行数量限制,比如对外国电影的数量设定配额,或者禁止在黄金时段播放外国电视节目。第二,国家试图通过向当地文化产业提供补贴和税收减免来促进本国生产(Baughn和Buchanan 2007)。起初,保护主义确实有助于国内文化产业的发展。然而,在过去的几十年里,在自由化的国际贸易制度的影响下,许多国家都取消了对文化产品的保护主义措施(Burri 2012)。然而,媒体受众仍然更倾向于文化上的近似产品。

将这些关于全球媒体消费中文化接近性的成熟文献与我们目前的主题联系起来,我们认为人们可以更容易地在网络上制定他们对文化接近性内容的偏好。首先,在大多数国家创建网页不需要监管许可,不像电视频道需要广播许可,电影需要审查委员会或评级机构的许可。其次,网络提供了许多 “平台”,允许普通用户分享他们创造的内容,通常只需极少的资源,并将其上传到网上。因此,只要有一台连接互联网的电脑,就有可能以最低的成本创建、托管、填充和普及网站。此外,在线内容通常可供来自任何地点的用户免费使用,除非所有者希望根据访问者的具体地区限制其访问,或者某些国家禁止国内观看特定的网站,如中国的情况。

互联网接入阻塞和用户行为

假设用户行为是由文化接近性驱动的,我们认为国家审查制度对在线行为的影响类似于传统媒体中的文化保护主义。两者都促进了文化定义的市场的形成。它们通过三种方式实现其效果。首先,根据定义,正如文化进口管制旨在将受众的媒体饮食限制在国家产品或国家允许的进口产品上一样,互联网接入的封锁也限制了用户浏览外国网站,从而将他们限制在国内的互联网环境中。

然而,更值得注意的是,GFW通过两种间接机制强调了对国内网站的消费。首先,通过封锁外国网站,它就像一个贸易壁垒,使国内产业的增长得以实现。没有外国竞争显然促成了中国版Facebook、Twitter和YouTube的巨大成功,以及中国在线服务提供商的总体快速扩张(C. Liu 2010)。因此,中国的用户只能从众多的国内产品中选择。其次,国家审查制度也限制了人们对其媒体选择的了解。因此,通过改变有关媒体可用性的信息环境,GFW可能在人们不知不觉中塑造了他们的浏览偏好(Webster 2011)。因此,GFW很可能通过提供大量不同的本地产品,以及培养人们对本地产品的偏好,促进了中国CDM的巩固发展。

我们预计,即使取消GFW,人们也会继续消费本地网站,使以前被封锁的外国网站得以进入。一旦国内生产者设法从国外重新获得流行的文化形式,他们 “在争夺观众方面就有明显的优势”(Pool 1977, 143)。因此,当本地内容变得广泛可用时,它就会超越外国内容,引起人们的注意。此外,如果GFW确实像刚才讨论的那样,主要通过间接机制发挥作用,那么中国人可能会出于习惯继续他们现有的浏览模式(图1)。

总而言之,我们不认为人们会不分青红皂白地使用他们可以访问的所有网站,而是认为他们主要喜欢全球互联网上文化上接近的网站。在这种观点中,只有在阻止用户浏览文化相近的内容时,访问封锁才是胁迫性的。此外,通过潜在地帮助国内内容(包括中文内容和以中国为中心的内容)的增长,并限制人们对外国选择的了解,中国的互联网审查制度可能促进了WWW上CDM的形成。我们进一步认为,经过十年的实施,即使今天取消了封锁,中国用户也不可能大大改变他们的浏览行为(图1)。任何解释中国网络使用情况的实证研究都必须将文化因素(如语言和内容的地理重点)与国家施加的访问封锁结合起来,正如我们在本研究中所做的那样。

Figure

图1. 被封锁的网站的比例远远低于主流话语中所暗示的。见我们后面的数据分析。

数据、措施和方法

受众重复性

如今,大多数媒体用户都有大量的媒体渠道供他们使用。然而,他们并不消费所有这些选择,他们专注于少数这样的子集,通常被称为 “媒体重构”(Taneja, Webster, Malthouse, and Ksiazek 2012)。这些组合可以基于一些因素,如用户的偏好和他们能够获得的平台和内容。当进行综合分析时,这些剧目的构成表明相同的受众会消费哪些媒体和/或内容。因此,为了确定这些组合,我们不仅需要知道有多少人消费每个媒体渠道,还需要知道他们如何在不同渠道之间流动。这种信息通常由一种叫做受众重复率的措施提供。

受众重复率是指两个媒体被相同的受众所消费的程度。例如,在任何给定的一天,如果一个人口中的100人中有20人同时观看福克斯新闻和有线电视新闻,那么这两个媒体机构的受众重复率在这一天将是20%。同样,对于一个给定的受众,可以计算出所有可能的媒体机构对的重复率。这就形成了一个对称的受众重复矩阵,其中的元素Ai,j代表媒体机构i和j有共同的受众的程度。这样的矩阵可以被进一步分析,以确定有共同受众的媒体机构的集群。受众重复的最早应用是识别用户定义的节目类型,即由同一组用户观看的电视节目的子集(Webster 1985)。Webster和Ksiazek(2012)最近使用受众重复来研究美国互联网用户经常一起使用的网站的曲目。在这项研究中,我们使用了这样一种方法。

我们获得了所有可能的最受欢迎网站对之间的受众重复率数字。在此过程中,我们将任何两个网站之间的重复率定义为在任何可能的配对中访问这两个网站的独特用户的百分比。这揭示了受众在所有网站对之间移动的程度,而不考虑这些网站的语言和地理重点(如果有的话)。由此产生的受众重复矩阵可以帮助调查WWW消费是否聚集在文化定义的市场中。在详细介绍这些方法之前,我们先介绍一下我们的受众重复数据的来源。

数据:comScore

在这项研究中,我们使用了comScore的数据,这是一个基于面板的服务,每月提供一次互联网受众测量数据。它是目前同类产品中最大的连续测量的受众小组。comScore小组在全球170个国家约有200万消费者接受连续测量,它利用一个仪表,通过小组成员的电脑捕捉行为信息。数据从小组成员的工作和家庭电脑中收集。与该小组相辅相成的是一种普查级的数据收集方法,它可以将通过服务器获得的总体水平的互联网行为与通过comScore小组获得的受众信息结合起来。

comScore按网络域名和子域名对网站进行组织。我们决定我们的样本将是世界上前1000个网络域名(按每月独立用户数排名),因为这个数字不仅涵盖了99%的网络用户访问的大部分域名,而且确保了不同语言和不同地域的网站的充分代表性。对于许多大型网站,如谷歌,不同的地理语言变体被归类为独立的域(例如,www.google.es,www.google.de,等等)。对于某些大型域,如维基百科,语言版本是主域的子域(例如,es.wikipedia.org)。在这种情况下,这些子域已被考虑在最终的样本中,而不是限制在顶级域中。这些数据反映了2012年6月的流量,最终样本中包括973个网站。这些网站涵盖了总共50种语言(许多网站使用多种语言)。对于这973个网站中的每一个,我们都获得了它与所有其他972个网站的受众重复率。因此,最终的数据集有472,878((973×972)/2)对受众重复数。

我们在2012年11月从GreatFire.org收集了审查数据,这是一个在线组织,分享自2011年初以来关于GFW封锁的实时和历史信息。GreatFire允许用户访问其日常监测的数千个网站的封锁记录,也可以测试他们自己的URL。考虑到GFW不断调整的性质,对于已经建立GreatFire档案的大多数样本网站(每月进行几次测试),我们根据它们在过去30天内是否被封锁来对审查数据进行编码;对于其余一部分未被GreatFire监测的网站,我们在现场对它们进行测试并记录结果(无论是否被封锁)。共有99个网站被封锁,包括21个娱乐网站、18个文件和照片共享服务、13个社交媒体网站、4个新闻网站和2个门户网站。

其中一位作者访问了每个网站,并注意到每个网站提供的所有语言的内容。此外,我们依靠自我描述、元数据和第三方来源(如Alexa.com)来确定网站的地理重点。对于大约三分之一的网站,如果我们不能指定一个国家,我们就把它们归类为全球。大多数属于 “全球 “类别的网站都有因语言而异的子域,有时还为不同的国家定制内容。

方法

我们对观众重复数据使用了一些分析程序。首先,我们用一套网络分析工具分析了所得到的受众重复矩阵。这些工具表明,具有高度重复受众的网站的基本集群的证据很高。其次,我们对这一矩阵进行了分层聚类,以确定这些经常一起消费的网站的曲目。这些组合似乎与全球互联网的使用模式很一致,即存在CDMs。我们发现,大量关注中国大陆的网站构成了这样一个集群。我们研究了这些群组中每个群组与网络其他部分的平均距离,以了解它们的相对隔离情况。此外,我们还根据网站的文化接近程度考察了其在中国集群中的成员情况。在接下来的章节中,我们报告了我们的发现,同时也更详细地描述了这些分析程序。

分析和结果

分析全球在线受众的流动情况

如前所述,我们将受众重复矩阵概念化为一个网络,973个网站为节点,访问这两个网站的独特用户占总网民的百分比为纽带。然而,由于任何两个网站都会有一定量的受众重叠,我们认为只有当重复率高于随机机会所预期的情况下,才会存在联系。例如,如果在一个特定的时间段内,某个网站A的独特用户覆盖率为所有互联网用户的10%,而网站B的覆盖率为50%,那么假设两者的消费是独立的事件,5%将是同时访问A和B的预期用户数。对于所有这些配对,只有当观察到的重复率大于预期值时,我们才认为存在联系。因此,网络中纽带的价值就是网站之间大于预期的重复率。对于一些衡量标准,我们使用了二分法的领带,即我们认为领带的存在是1,不存在是0。

在得到这个网络后,我们首先进行了一些描述性分析,以确定其整体结构。我们对整个网络和单个节点进行了分析。我们首先报告了整个图形的一些综合措施。聚类系数(在0和1之间变化)表示图中任何三个节点形成一个三角形(即一个连接的三角形)的平均趋势。这个衡量标准的高值表明,一个网络是由社区组成的,社区内的互连性高,而社区之间的互连性低。对于这个图,我们发现聚类系数相当高(未加权0.846,加权0.752,网络密度=0.395)。这些表明,网站聚类的方式是,属于同一组的所有网站之间有很高的受众重复率,属于不同组的网站之间的重复率相对较低。对网站的目视检查也证实了尖锐聚类的存在,相同语言的网站或迎合相同地域的网站似乎都聚集在一起(见图2)。

Figure

图2. 文化定义的市场(通过聚类分析确定)。每种颜色对应于一个文化定义的市场(见图例)。如果你正在阅读黑白版本,请访问彩色版本:www.tandfonline.com/utis 。1体育博彩在波兰是合法的。2这些都是二线(不包括Facebook、Twitter和LinkedIn)社交网站,在非洲国家拥有不成比例的大量用户。这可能是因为它们需要的带宽比其他大多数网站低。

识别文化定义的市场(CDMs)

由于这个受众重复网络通过视觉检查和网络分析措施都表明存在紧密的集群,我们对受众重复矩阵进行了分层聚类。我们用大于预期的重复率作为衡量网站之间相似性的标准。换句话说,两个网站之间共享受众的比例越大,超过预期的重复率,我们认为它们就越接近。我们得到了一些在分层聚类程序中常见的解决方案。根据树状图,我们选择了有37个聚类的聚类,尽管这些聚类中有许多是单一的网站或成对的网站,在这些聚类之间架起了桥梁。除了这些桥梁(我们在后面解释),我们还剩下953个网站(在我们的样本中共有973个),它们被聚类为18个社区。

这些社区很符合我们对文化定义市场(CDM)的定义,因为聚集在一起的网站要么使用相同的语言,要么迎合相同的地理环境,有时还共享语言和地理环境。其中最大的集群包含所有以英语国家受众为主的网站,如美国、英国和澳大利亚。甚至许多有多种语言内容的全球网站(如Facebook和Twitter),主要是由于它们在美国和英国的庞大用户群,也是这个集群的一部分。第二大集群是专注于华语地区的网站,包括繁体中文和简体中文的网站。同样地,我们观察到更多这样的文化定义集群,我们在图2中列出了这些集群,并进一步说明了其组成网站的语言和/或地理重点。

其他可能的解决方案(基于树状图)也显示了沿着地理语言线的聚类。一个集群数量较少的解决方案将日本、印度尼西亚和泰国的网站与英国和美国的网站结合起来。另一个集群数量较多的解决方案产生了超过200个集群。这两种解决方案都不利于我们预期的分析水平,也就是分析各国的行为。

乍一看,我们很想解释这些聚类本质上是网站语言的表现,但语言只提供了有限的解释。例如,我们的第四大集群虽然以法语网站为主,但也有阿拉伯语网站(来自摩洛哥、埃及和泛区域网站,如阿拉伯语维基百科和阿拉伯语雅虎),因此被解释为以法语文化为中心的网站集群更为恰当。同样地,所有以印度为中心的网站,尽管是英文的,但都被隔离成一个自己的集群,而不是与其他以英国和美国为中心的英文网站一起。我们的地理语言集群的一个例外是一个关注足球的网站集群。对每个群组成员资格的进一步分析超出了本文的范围,但我们对中文群组(图2中的群组2,以下简称 “C群组”)的分析也会对其他群组有所启发,因为我们希望类似的因素能够解释每个CDM的成员资格。

在没有进入任何一个集群的20个站点中,有许多实际上是连接这些集群的站点。在网络分析术语中,这些桥接节点出现在从网络中任何节点到任何其他节点的大量最短路径上。在这个网站受众重复网络中,这样的网站被来自不止一个CDM的受众访问。事实上,它们包括像文件共享平台这样的内容中立平台,以及像Windows Media Player、Acrobat和英特尔这样的大型技术公司,它们的许多语言/国家特定网站都属于同一领域。

文化定义的市场的相对孤立性

图2给人的第一印象可能是,WWW是由两个社区组成的。中国和世界。访问受阻似乎是中国网站被隔离背后最明显的原因。然而,这种CDM在视觉上最为突出,仅仅是因为中国拥有最大的在线人口;还有190个网站(在973个中)针对中国,是我们样本中任何国家中最大的。为了证实这一直觉,我们根据这些CDMs中每一个的群体紧密性中心度计算了一个隔离度(Everett和Borgatti 1999)。这个群体层面的衡量标准表示该CDM中的节点(被视为一个群体)与该CDM之外的网络中所有其他节点之间最短路径的平均距离。例如,一个有站点的CDM与网络中的所有其他站点共享受众,其接近度为1,因为它与所有其他节点只有一步之遥。亲密性中心度越高,我们认为该CDM与WWW的其他部分越孤立。

我们在图2中报告了隔离度(基于群组紧密性中心度的测量)。正如人们所期望的,全球CDM是最不孤立的集群。印度的CDM紧随其后,这并不奇怪,因为这里包括的印度网站都以英语为主要语言。中国CDM属于隔离度相对较低的集群,其得分几乎与日本CDM持平。事实上,大多数由语言决定的CDM都比中国或日本的CDM更孤立。特别是土耳其语、韩语、越南语、意大利语和波兰语CDM依次是最孤立的聚类。总的来说,网站的语言和地理重点似乎都有助于CDM的隔离。

作为WWW上的中国CDM的C- Cluster

C群由194个网站组成,其中大部分为简体中文,其余少数网站以繁体中文运作。与外部的中文网站相比,例如许多跨国企业网站的中文版,C群中的成员倾向于提供具有明显 “中国特色 “的信息或服务。例如,音乐分享网站以中国艺术家为特色,社交网站以中国学校和公司为中心,网上商店为中国城市提供服务,而新闻门户则监测中国领土的起伏。在这里,一个完整的网站谱系涵盖了日常生活的各个方面,包括33个信息门户/搜索引擎,26个在线服务,如主题讨论区和资源共享网站,24个提供多媒体娱乐的网站,20个游戏网站,18个零售购物网站,7个社交媒体网站,以及6个由传统新闻媒体运营的网站。不难想象,互联网用户可以舒适地居住在这样一个自给自足的虚拟世界里。

从图中可以看到一个有趣的现象(图1),那就是C类群内的网站与网络其他部分的连接性质。在这些网站中,最突出的桥梁是alibaba.com,一个基于中国的小型企业的在线企业对企业的交易平台。在中国制造能力的推动下,作为同类网站中最大的一个,它吸引了全世界的访问者。然而,更耐人寻味的是其他桥接网站,包括中国的维基百科。与其他CDM不同的是,维基百科倾向于让其各种语言版本占据中心位置,而维基百科的中文域名被推到了边界,这可能是由于缺乏源自中国的参与。作为桥梁的还有几个香港和台湾的网站,其中大部分被中国政府封锁,以及相当数量的中国大陆的娱乐网站,包括视频/音乐共享平台和在线游戏门户网站。

TABLE 1 C-cluster membership
  Chinese cluster
Classification ofCultural 
websiteproximityNonmemberMember
In Chinese* and China focusHighest0 (0%)189 (2%)
In Chinese and Taiwan and Hong Kong focusHigh04 (75%)
In Chinese but global focusLow105 (24%)1 (0%)
Neither in Chinese nor Greater China focusLowest674 (10%)0
Total number of websites 779 (12%)194 (4%)

我们还想研究文化接近性和访问障碍如何分别解释一个网站是否成为C类群的一部分。为了研究这个问题,我们按照文化接近度的四个级别对网站进行了分类。我们将以中文(简体或繁体)为主要语言、以中国为主要地理区域的网站标注为文化接近度最高。百度网和微博网就是此类网站的例子。接下来,我们把以中文为主要语言、以香港或台湾为主要地域的网站称为文化接近度 “高 “的网站。Wretch(一个在台湾流行的博客平台)和雅虎香港就是这一类网站的例子。在下一类网站中,我们称之为 “低 “文化接近度的网站,是那些将中文作为其众多语言之一、将大中华区作为其众多地域之一的网站。这类网站的例子是 “全球 “网站BBC和Wordpress.com。最后一类是文化接近度 “最低 “的网站,包括既不关注中国又没有中文的网站。

在表1中,我们报告了从这些文化接近程度的每个级别中进入C类的网站的数量(在行中)。在每个单元中,我们还报告了被屏蔽的网站的百分比。C级群组包括被封锁和未被封锁的网站。在其194个网站中,有189个专注于中国大陆,其中只有2%被屏蔽,有4个网站专注于台湾和香港(”高 “文化接近度),其中3个被屏蔽。一般来说,文化上有距离的网站并不与C群中的其他网站组合。在关注全球的多语言网站(有中文版本)中,106个网站中只有2个(新华网和CNTV.com)与C类网站分组。在这一类别的105个没有进入C组的网站中,有25个实际上被封锁了。最后,文化上最不亲近的网站没有一个是C组的成员。

讨论

我们的研究对广泛持有的假设提出质疑,即访问封锁导致中国互联网与所谓的全球化的WWW相隔离。我们将WWW概念化为网站之间的共享受众网络,并发现,互联网不是一个全球化的完全连接的社区,而是表现为许多文化定义的市场的集合,而中国就是其中之一。对中国CDM的仔细分析表明,在塑造在线用户行为方面,文化的接近性比访问的阻隔性具有更大的作用。在本节中,我们将讨论我们的主要发现的含义。

首先,这些CDM本质上是网站的社区,它们要么有共同的语言,要么有共同的地理焦点,而且往往两者都有。C集群就是这样一个社区,其网站构成与其他CDM(如日本、韩国和俄罗斯)相当相似。每个CDM都是一个自给自足的集合,有各种各样的网站来满足典型互联网用户的饮食。特别是,我们发现C组不限于中国大陆的网站,还包括香港和台湾的网站。这种配置与研究区域文化市场的学者所说的 “大中华区 “相呼应,”由其三个主要构成部分之间的[政治、文化和经济]互动来定义”(Chan 2005, 174)。

其次,我们发现,文化的接近性而不是阻隔性解释了C类群的成员。如表1所示,这个群组主要由文化上最接近的网站(即以中国为主题的中文网站)组成,而这些网站很少被封锁。它还包括所有以香港和台湾为重点的网站,尽管GFW屏蔽了其中的大部分。在以中文为语言之一并以 “全球 “地理为重点的网站中,GFW的影响不太明显。在这些网站中,归入C类的两个网站是中国的国营新闻机构和电视网络,它们都试图争取全球的受众。在这个类别的非成员中,近四分之一的网站被封锁。如果不是因为GFW,有些网站可能已经进入了C类。被封锁的网站,如Facebook和YouTube,毕竟是中国侨民使用的。然而,有几个案例表明,GFW的强制干预力度相当有限。例如,在2010年最终退出之前,谷歌为争夺中国搜索引擎市场的份额与百度进行了两年的斗争,但没有成功。此外,尽管GFW对中文维基百科的封锁在2008年被解除,但其用户仍然主要来自香港、台湾和中国侨民。中国大陆的用户则停留在沪东网和百度百科上,这是在维基百科不存在期间出现的两个本地类似的网站(Ng 2013)。

第三,我们发现,中国的CDM并不比其他CDM更孤立。值得注意的是,正如紧密性中心性得分(图2)所示,我们发现在亚洲(如日本)和其他地方(如德国和意大利),允许更多 “开放 “WWW的国家(自由之家2013)构成的CDM与中国CDM一样与其他WWW隔离。换句话说,我们的发现表明,许多人所警告的 “互联网的巴尔干化”(Goldsmith和Wu 2008),主要是由文化多样性驱动的,其影响在适用时,只会被国家过滤所加强。因此,关于国家广播的 “数字幕布 “分裂了全球互联网通信流的突出叙述是非常有问题的;在评估一个国家在WWW上的虚拟栖息地时,像中国的GFW这样的互联网封锁不应该是唯一的重点。

我们的发现提出了一个问题。这是否意味着,就实际使用模式而言,中国人并没有因为GFW而特别偏狭?连接C群和其他WWW的三个机制提供了一些启示。首先,某些来自中国的相对世界性的用户同时访问国内和未被屏蔽的国外网站。第二,中国大陆的许多用户通过过滤规避技术,除了访问允许的网站外,还访问被封锁的网站。这种做法有其先例,如捡拾电视信号溢出物、音乐CD走私和电影盗版,所有这些都长期存在,并有助于破坏中国政府的限制(Chan 2005; De Kloet 2010; Wu 2012)。第三,C组群内外网站的受众重叠,也可能是由于香港和台湾的用户,以及分散在世界各地的海外华人经常访问中国大陆网站。桥接网站要么专注于香港和台湾,要么是来自中国大陆的用户生成的内容网站,这一事实支持了最后一种解释。中国侨民是世界上规模最大、分布最广的侨民,他们的网络使用情况也可以部分解释C组群的低隔离度。

为了确定这些受众群体的行为对C类群内外网站被访问的桥接区域有多大影响,需要有受访者层面的数据,以便分析以用户和网站为节点的双模式网络。不幸的是,我们无法获得这些数据,因此无法确认上述每一种机制在多大程度上起作用。无论如何,所有这些机制表明,即使封锁阻止了对外国网站的访问,与传统的进口管制不同,它不能阻止普通人之间的跨境互动。这些在中国境内外的人们之间的互动产生了WWW上文化流动的新维度。

总而言之,尽管GFW是一种以地域为重点的互联网监管形式,但我们的研究结果表明,它并没有将 “中国互联网 “与全球互联网进行大的分割。此外,我们的研究结果挑战了西方政策制定者、流行媒体以及通常的学术著作中的主流话语,这些话语认为访问封锁的唯一功能是对用户行为的强制干预。

基于这些发现,值得推测的是,解除封锁将如何重塑中国的CDM。首先,由于文化上的接近性,C群中的现有网站很可能会继续粘在一起。主要的变化是在桥接区,其中包括目前被封锁的香港和台湾的网站。如果这些网站可以被中国大陆自由访问,我们有理由期待它们会被拉近与密集连接的大陆网站的距离,因为它们所承载的内容对中国的用户具有吸引力。然而,我们认为,这些网站不会成为集群中的中心,因为它们对香港和台湾有着强烈的本地关注,许多中国大陆人可能会发现它们的意识形态色彩令人不快,或者它们的内容不相关。即使是那些内容与文化最接近的被封锁网站,解除封锁也不会导致其位置的巨大变化。例如,正如已经指出的,经过4年的封锁,并在2008年重新开放,中文维基百科未能在中国积累大量的用户群(Ng 2013)。我们还预计,由于更多的中国人将参与全球社交媒体网站,如Facebook、Twitter和YouTube,C类群作为一个整体将向WWW的其他部分靠近。尽管如此,一个独特的中国CDM仍将存在,就像日本、俄罗斯和韩国的CDM一样,因为无论是否有访问封锁,用户都会消费文化上的近似内容。因此,与消除中国的GFW(大多数政策、民众和学者的讨论都集中于此)相比,对抗国内网站的内容审查可能会给中国人在互联网上使用的内容带来更多实质性的变化,这可能会促成进一步的文化变革。

最后,我们强调,在研究政府对互联网使用的控制时,要采用社会学的方法,即以封锁的形式。这种方法偏离了古典自由主义中根深蒂固的规范性规定(Cramer 2013)。它将互联网的使用视为特定社会条件下的文化消费。对中国电影进口管制的研究也出现了类似的转变,管制首先被认为是意识形态的操纵,然后是文化保护主义,最后是中国盗版电影消费的复杂动态中的一个因素(Wu 2012)。对其他非民主背景下的国家审查制度的研究也主张进行经验性的审视(例如,Abramitzky和Sin 2010)。我们的研究扩展了这一立场。我们表明,互联网封锁不应轻易地被视为针对某些假设的自主和规范的预期行为的外部强制力;相反,它应该被作为塑造媒体选择的许多结构性方面之一进行调查。