贴身宝贝|新 农 村|政策法规|三农之窗|区域经济|三农投资|农贸资讯|三农科教|文化生活|三农探索|三农人物|三农专题
写作大全|招工招聘|农资购销|农产购销|致富信息|书刊信息|农网导航|打假维权|三农服务|三农调查|三农论坛|三农内参
地方频道
您可以选择查看各地信息
请选择省:
请选择市:
请选择县:
[关闭]
政务频道
行政职能查询:
行政区划查询:
三农人物
频道简介
当前位置 ->首页 -> 三农人物 -> 学术权威
龚为纲:从互联网大数据看社会心态的阶层差异及其逻辑
时间:2018-10-09 01:42:07来源:三农中国作者:
摘要:本研究试图整合情感社会学相关理论资源,借助互联网大数据及其相关算法,对当前中国社会各阶层情绪体验的突出特征进行归纳,对阶层互动各场景中的情感氛围进行比较,并据此透视当代中国社会结构与阶层关系。研究发现,从各阶层的总体性情绪体验指标来看,社会上层与中产上层情绪体验的积极程度明显高于中产下层和底层。情感体验的阶层分布逻辑在于,底层比上层更多地暴露于多种类型的压力与风险中,而且这些压力更容易在底层唤起负面情绪。从阶层互动场域的“情感氛围”来看,不同阶层互动场域中的情感氛围明显不同,上层精英阶层之间互动的情感氛围相对和谐,而上层与底层、中层与底层互动场景中情感氛围相对紧张。上述有关情绪体验的阶层分布特征,有助于透视转型时期的阶层关系与社会结构。

关键词:社会情绪,大数据,阶层,阶层互动

一、研究问题

自1978年以来的体制转轨进程中,中国社会结构开始剧烈分化,强调个人自致属性的职业机制逐渐成为新的社会分化机制,社会经济资源的获取途径日益多样化,从而使阶层结构在改革之后进入快速分化的进程[①]。社会分化的后果表现在一系列政治社会领域,已有研究对阶层分化过程中各阶层的消费倾向、居住空间、文化资本与文化品位、社会资本、阶层意识等议题进行过富有成效的研究。

值得进一步注意的问题是,社会的阶层分化在现实层面既表现为阶层之间在生活水平和生活方式上的差异日益明显,更使得人们的认知方式、价值观念和情感心理开始呈现出根据所属阶层而分化的特征[②]。故而,对不同阶层的社会心态进行研究就同时具有重要理论意义和现实意义。已有社会心态相关研究侧重于社会分化进程中各阶层的阶层意识[③]、幸福感、不公平感[④]等,而社会情绪作为社会心态中的核心要素,情感社会学领域有少量关于中国不同阶层之社会情绪的相关讨论,但主要聚焦于理论探索层面[⑤],在实证层面则语焉不详。另外也有研究针对一些具体的负面情绪做过分析,比如成伯清、王俊秀、马广海等人对嫉妒与怨恨,王佳鹏对羞愧情绪,杨宜音等人对浮躁情绪,周晓虹、李春玲对焦虑情绪等都做过深入分析[⑥]。总的来说,社会情绪相关研究还存在以下问题需进一步推进。

一是需要将社会情绪纳入社会结构中进行思考。社会情绪是大众在社会心态层次上的主观性体验,这种主观性体验既是当前快速社会分化的产物,也是透视社会结构及其问题的社会表征。通过分析社会各个阶层中的突出性情绪问题,寻找其根源,进而为塑造“理性平和、积极乐观”的社会心态提供治理之策。

二是需要将社会情绪嵌入到社会情境中进行分析。社会情绪的产生与社会互动有关系,不同阶层的互动关系是完全不同的,如果研究者能够呈现不同阶层互动时的“情感氛围”,这不但有助于我们理解社会情绪生成的结构性背景,而且还有助于借此理解社会转型时期的阶层关系。

本文试图回答,在社会转型过程中,中国社会正在产生快速阶层分化,不同阶层除了在主导性生产方式、文化资本、消费倾向、社会资本等领域存在阶层分化之外,在社会情绪上是否也存在系统性差异?这种差异的形成机制是怎样的?社会情绪的产生往往有阶层互动的背景,那么不同阶层互动场景中的“情感氛围”是否有所不同?阶层互动的情感氛围折射出当前中国阶层关系的何种特征?

二、文献回顾与分析框架

从社会心理学角度看,社会情绪是一种集体情绪,即一定社会环境下某一群体或者某些群体或整个社会中多数人所共享的情绪体验,社会情绪并非个体情绪的叠加或混合,而是个体之间、个体与群体之间、群体与群体之间互动的结果[⑦]。

故而,社会因素作为影响社会情绪的重要源头长期以来被学界所重视,已有社会情绪研究常常把个体的情绪、情感放在社会结构中进行理解。这方面,西奥多.肯珀的权力-地位理论、柯林斯的仪式互动理论堪称经典,这两种理论的核心逻辑认为,客观的社会结构性位置会影响公众的社会心态和情绪体验,不同阶层的社会位置塑造了不同的生活模式,而生活模式塑造了人的性格结构,故而不同的客观性结构位置会对人的性格结构与情绪体验产生影响[⑧]。西奥多.肯珀、柯林斯等人有关情感的社会分层模式极有启发意义,而且所作的机制解释也极富洞见。但问题在于,与心理学中有关情绪个体和微观层面的实证研究相比,已有情感社会学有关情感分层的理论很难采取实证的方法去验证,这是已有情感社会学理论的劣势。就情绪体验的社会分层而言,能否在实证层面得到检验呢?

客观性的结构性位置是否会转化成为情绪体验上的差异,这个问题在实证层面有待检验。更为重要的问题是,结构性位置作用于情感体验的具体机制。

本研究认为,不同的社会结构条件会诱发不同的情绪类型。这里所谓的结构性条件,在本研究语境下主要是指阶层结构。阶层结构既包括行动者所在阶层位置,也包括不同阶层行动者互动所形成的关系结构。这种考虑,主要与社会分层领域两种研究社会阶层的视角有关系。在已有的社会分层的理论脉络中,认为既定社会的阶层结构既可以视为阶梯性的,也可以视为关系性的。阶梯性模型依据社会成员拥有资源的多寡来确定其在社会阶梯中地位,用该模型描述阶层结构,能发现主要资源、生活机遇的不平等状况。关系性模型把社会成员间的权力-利益关系视为阶层分析的核心议题,强调以社会关系确定阶层地位[⑨]。

本研究认为,这两种社会分层视角,有助于揭示社会情绪生发的结构性条件。

(1)从阶梯性的视角看,不同社会成员处于不同的结构性位置,有不同的社会资源,正如情感社会学领域的权力-地位模型所认为的那样,不同的结构性位置产生不同的情绪体验。结构性位置与情绪体验之间的关联机制很多。考虑到本研究主要分析社会负面情绪的阶层分布及其逻辑,我们试图借助精神健康社会学领域的压力-过程模型理解结构性位置与情绪体验之间的关联机制。在社会分层与心理健康问题这一研究领域,社会结构被看作影响个体健康结果的根本原因,阶层等结构性因素主要通过影响社会压力的阶层分布形塑社会情绪,其核心机制主要有两层:一是压力暴露存在阶层差异,二是在应对压力时,不同阶层的脆弱性不同,即压力易感性。

压力暴露的阶层差异。压力过程模型的第一个研究维度多涉及对于具体的压力来源的探索,例如,急性生活事件、慢性生活压力, 以及日常生活烦恼等。本研究试图将这作为社会情绪阶层分化的一层重要机制。其中的逻辑在于,不同社会地位的群体处于不同的生活环境中,因而受到不同类型和不同程度的压力影响。即压力暴露的阶层差异,构成社会情绪阶层分化的第一层机制。

负面情绪易感性的阶层差异。所谓压力的易感性,是指容易因为生活压力而产生情绪问题或者患心理疾病的程度。压力-过程模型中的易感性机制表明,由于各阶层的群体性差异,不同社会地位造成不同的生活环境和社会经历,同样面对风险与压力,不同阶层可能会产生不一样的情绪反应,社会地位较高的人群对压力的感受更为积极,相同的压力事件对不同阶层产生的影响是截然不同的。故而,易感性的阶层差异构成社会情绪阶层分化的第二层机制。

(2)从关系性视角来看,社会情绪的生成机制,与社会情绪本身的属性有关。正如王俊秀等人在总结社会情绪的属性时所指出的那样,社会情绪是一种集体情绪,即一定社会环境下某一群体或者某些群体或整个社会中多数人所共享的情绪体验,社会情绪并非个体情绪的叠加或混合,而是个体之间、个体与群体之间、群体与群体之间互动的结果。因而,对社会情绪产生的互动情境进行分析是非常重要的。而社会互动是发生在具体场域中的互动,场域是权力、利益等要素交织而成的关系结构。从社会结构的角度看,最主要的结构莫过于阶层结构,不同的阶层互动,存在不同的结构性关系。那么不同的阶层互动所构成的场域中的“情感氛围”是否有所不同呢?很显然,在不同阶层相遇的场域中,如果情感氛围存在显著性差异,那么我们可以进一步认识情绪体验的阶层特征,进而理解阶层互动对于情绪体验的影响,这时候的情绪体验,不是单个阶层所独享的情感体验,而是两个或多个阶层共同体验的“情感氛围”。

基于上述判断,我们提出如下研究假设:

研究假设1:不同的客观性结构性位置上会产生不一样的情绪体验,就总体性情绪指标而言,社会情绪的积极程度与阶层地位成正相关,消极负面情绪与阶层地位呈现负相关。

研究假设2:从压力过程模型的视角看,压力暴露程度与压力易感性都与阶层地位正相关,底层的压力暴露程度高于上层,其压力易感性也高于上层,二者的阶层分布构成社会情绪阶层分化的两层重要机制。

研究假设3:社会情绪的形成与阶层互动有关,不同的阶层互动下的场域,有可能存在完全不同的情感氛围,缓和的阶层关系更有助于产生积极情感氛围,而对立紧张的阶层关系,更倾向于产生消极负面的情感氛围。

三、数据与方法

本研究的数据来源为互联网大数据GDELT(全球事件、语调与语言数据库),该数据库由谷歌开发者Kalev Leetaru创建。2011年,《科学》杂志上发表了以哈佛大学、麻省理工学院与谷歌研究团队利用谷歌图书(Google Books)的海量数字化资料,分析了公元1500到2000年间500多万本书籍高达5000多亿单词的语料库,并提出了“Culturomics”(文化组学)的概念,所谓“文化组学”是指用计算语言学的方法对大量电子文本信息进行定量分析进而研究人类行为和文化趋势的方法[⑩]。Kalev Leetaru等人在此基础上,提出了“文化组学2.0”的概念,即试图通汇聚互联网空间中的信息理解整个世界,探索人类社会如何运行,特别是人类的社会互动和社会行为。GDELT数据库,就是在这样一种思想的基础上建立,其具体方法是,实时监测全球网络空间,世界所有国家的门户网站、印刷媒体、电视广播、网络媒体、网络论坛中的新闻事件,对其进行分析提取,提炼出新闻事件相关的人物、地点、组织和事件类型等关键信息。自从2015年2月以来,GDELT已经汇聚来自全球网络空间中的738,405,547条信息,数据体量高达7.7TB,很显然,这是典型的互联网大数据[11]。

本研究以GDELT中有关中国社会生活中发生的2900万个事件构成的案例库为依据,借助于社会学领域有关社会分层的操作化概念,将网络信息文本中常见的1600多种社会角色与社会活动主体概括为9大社会阶层,进而在大数据的语境下将社会阶层的概念进行操作化;借助于机器学习、WordNet[12]情感词库等自然语言处理技术,对中国社会的总体性情绪特征以及150多种负面情绪进行测量,进而尝试着将社会情绪进行量化,并呈现社会各阶层多重情感面向。

(一)阶层与压力指标的操作化

在GDELT数据中与本文密切相关的信息包含Themes、V2Tone、GCAM等维度。Themes这一列信息包含GDELT团队利用各种自然语言处理算法,从文本信息中提取53165个反应社会生活的主题[13]。本文以下信息都从Themes中提取。

一是职业群体的信息,GDELT数据库可以识别的职业群体和社会角色类型包含2243个,如果一则个案中包含了某种职业角色,比如说警察,则赋值为1,没有则赋值为0,这样,针对一个文本个案,就形成了2243个0/1变量。本文从中提取了其中的1600多个能够反映职业特征的类型信息,然后结合李路路等人的社会分层框架[14],将这1600多个职业群体划分为9大社会阶层[15]。

二是压力过程模型中的相关信息,本文主要从6种社会生活中常见的压力与风险类型对压力来源进行测量,包括危机情境[16]、冲突情境、自然灾害、人为灾害、贫困与失业风险等。其中危机情境涉及到20多种类型,冲突情境涉及到51种类型,人为灾害涉及到95种类型,自然灾害涉及到163种类型。由于每一种压力类型下的子类繁多,本文通过因子分析提取主成分的方法,对这些信息进行综合,分别形成了6个压力指数,即冲突情境指数、危机暴露指数、自然灾害暴露指数、贫困与失业、人为灾害暴露指数等。

(二)社会情绪指标的操作化

社会情绪是指人们对社会生活情境的知觉,是通过群体成员之间相互影响、相互作用而形成的较为复杂而又相对稳定的态度体验,这种知觉和体验对个体或群体产生指导性和动力性的影响。[17]按照社会情绪的性质与投射方向,可以将它划分为积极社会情绪与消极社会情绪。诸如喜悦、快乐、信服、爱意等可以归入积极、正面社会情绪一类,而消极、负面、不良社会情绪则往往表现为愤怒、悲哀、郁闷、烦躁、仇恨等。

本文对社会情绪的测量分为两个层次,首先是总体性层次,包含积极情感指数、消极情感指数以及综合情感指数[18],总体性情感指数用于比较各阶层情绪状态的总体状况,其信息主要从GDELT数据库中的V2Tone这一列提取。其次是具体情绪类型层次,基于GCAM中WordNet Affect 1.1所监测的150多种负面情绪类型[19],本文主要侧重分析具体的负面情绪问题的阶层分布。

V2Tone主要包含了总体性情绪指标的信息,GDELT针对每一个个案,通过高性能自然语言处理技术,给出其综合情感指数tone,积极情感指数positive score,消极情感指数negative score。对各阶层的总体性情绪特征,我们主要从V2Tone中提取信息。综合情感指数Tone的范围大致在[-15,15]之间,不同的取值所对应的情绪状态如表1。

表1 综合情感指数的不同取值对应的情绪状态

英文

中文

Tone

英文

中文

Tone

ecstatic

欣喜若狂

9

neutral

情感中立

0

lovely

可爱的

4

dislike

不喜欢

-1

excited

兴奋的

3

hate

憎恨

-10

happy

幸福的

1

hatred

仇恨

-12


GCAM的全称是全球知识与变迁分类库[20],这个列下面,涉及到GDELT团队运用18种情感词库技术,对各种类型的具体情绪类型进行提取。本文主要使用了其中的WordNet情感词库提取的150多种负面情绪进行分析。

四、社会情绪的阶层分布特征及其逻辑 (一)积极情感指数、消极情感指数与情感综合情感指数的阶层分布

情感社会学理论认为,情感体验大致分为积极的情感体验与消极的情感体验。根据总体性情绪指标的二元划分,GDELT数据库对每个案例中的积极情绪与消极情绪做了精确的计算。我们通过这两个指标测量和比较各个阶层的情绪状态,即积极情感指数越高,说明该阶层的生活世界中体验着更多的积极情绪,具有更高的精神健康程度; 反之,如果消极情感指数越高,说明该阶层生活世界中体验着更多的消极情绪,精神健康程度相对较低。

根据GDELT数据库中的信息,计算各阶层消极情感指数和积极情感指数,为了便于阶层比较,我们对积极情感指数和消极情感指数进行标准化(见图1)。

从阶层之间相对比较角度看,处于相对下层的四个阶层,即农民、非技术工人、技术工人、办事人员等,其消极情感指数明显高于官员、企业家、知识分子、技术人员、小业主等阶层。或者说,上层(官员、企业家、知识分子)、中产上层(技术人员和小业主)的消极情感指数低于中产下层(办事人员和技术工人)和底层(非技术工人与农民)。消极情感指数的阶层分布符合研究假设1(图1)。

另外,分析结果也显示,积极情绪则不具有这样明显的阶层分布规律,积极情感指数的阶层分布规律呈现出“中间高,两头低”的特点,尤其是中产上层的技术人员阶层与小业主阶层的积极情感指数明显高于其他阶层。积极情绪指数的这样一种特征可以从图2中的综合情感指数得到显示。中产阶层的积极情绪明显高于上层和底层,这样一个结果能否反映出中产阶层的一些社会结构属性呢?比如已有研究认为,中产阶层属于社会中相对理性、乐观的阶层,这个问题值得进一步的研究进行确认,在此不展开。



说明:为了分析结果直观起见,图1中消极负面情绪以GDELT中计算出的原始数据为基础,进行了标准化处理,图2综合情感指数为数据库中计算的原始数据。


为了比较更为简便,我们用“积极情感指数”-“消极情感指数”,得到一个综合性的指标,即综合情感指数。如果综合情感指数为正,则说明积极情感体验超过消极情感体验,反之亦然。综合情感指数越高,说明情感体验的积极程度越高,反之则说明消极情感体验越强。透过这个指数,可以对各阶层情感体验的总体状况进行比较。综合2015-2017这3年的数据,我们发现,综合情感指数的阶层差异明显,或者说情感体验存在鲜明的阶层分化特征(图2)。

图2显示:上层(官员、企业家、知识分子)、中产上层(技术人员、小业主)的综合情感指数远远高于中产下层(办事人员,技术工人)、下层(非技术工人、农民);中产阶层内部分化明显,中产上层远远高于中产下层;中产下层(办事人员、技术工人)又明显高于底层(非技术工人、农民)。情感体验的这样一种阶层分布,大致符合阶层地位与情感体验的积极程度成正比的研究假设。

图2还显示:情感体验积极程度最高的是处于社会结构中间位置的技术人员阶层和小业主阶层,消极情感体验最强的是底层的非技术工人与工人阶层,上层的官员、企业家、知识分子等阶层,尽管物质生活条件和市场能力、社会地位是最高的,但这三个阶层并不是积极情感体验最强的。

上层的官员、企业家、知识分子阶层,具有较高的综合情感指数,其中企业家阶层又高于官员阶层和知识分子阶层。上层尽管在权力、财富、声望与知识、技术等稀缺资源的占有上处于绝对优势地位,但是这三个阶层并不是积极情感体验最高的。这三个阶层的情感体验远远优于底层,但是不及中产上层。很显然,这很难从物质财富的角度去解释,而可能与这三个阶层面临更大的工作压力有关系。众所周知,官员阶层与企业家阶层所承受巨大的工作压力,并承担比其他成员更重的责任,这可能是这两个阶层的积极情感体验不如中产上层的主要原因。

(二)代表性负面情绪的阶层分布特征

通过上文的分析,我们已经发现总体性情绪指标具有阶层差异性。不过,仅仅从综合情感指数的角度进行比较,还太过于笼统,下面结合数据挖掘过程中的一些发现,对各阶层存在的典型负面情绪做简要分析。

1、怨恨情绪主要集中在社会底层,怨恨情绪体验强度与阶层地位成负相关。国内学者已经注意到,当前中国社会心态领域的突出问题是怨恨情绪普遍蔓延。那么怨恨情绪具有怎样的阶层分布特征呢?数据分析显示,怨恨情绪的阶层分布,基本上呈现出根据阶层地位的低到高,而呈现出由强到弱的态势;阶层地位越低,怨恨情绪越强;阶层地位越高,怨恨情绪越弱。处于社会底层的非技术工人和农民的怨恨情绪最强,远远超过其他阶层,中间的三个阶层(办事人员、小业主与自雇者、技术人员)的怨恨情绪次之,处于社会上层的精英阶层(官员阶层、企业家阶层与知识分子阶层)的怨恨情绪最弱(图3)。

图3 怨恨情绪的阶层分布

2、反腐败高压下,官员阶层的恐慌情绪突出。与其他阶层相比,官员阶层的恐慌、忧虑、自我贬值等情绪体验更为明显(图4)。恐慌主要与近年来的反腐败高压有关。而八项规定、简政放权等使得官员阶层的“任性”空间少了,灰色收入少了,公务员阶层“含金量”降低,让不少官员有“自我贬值”情绪体验。

图4 各阶层中突出的负面情绪体验

3、商业气候、制度性环境与企业家阶层的不安全感。与其他阶层相比,不安全感在企业家阶层中最为明显(图4)。自2008年金融危机以来,全球经济复苏长期乏力,而近年来中国经济社会也进入去过剩产能、调结构等新常态,企业债务危机严重,这无疑会让企业家阶层压力加重。更为重要的是,企业家阶层的不安全感或许与当前中国的制度环境有关。企业家阶层,作为社会转型的既得利益群体,在过去激烈的国内外市场竞争下,积累了巨额财富。但问题在于,由于国有企业改制的过程被认为是“企业家瓜分国有资产的盛宴”(郎咸平语),以及企业运营过程中存在的大量官商勾结与腐败行为,使得该群体的巨额财富存在巨大麻烦,以至于不安全感如梦魇一样扩能绕着该阶层。近年来,大量腐败官员落马的同时也有大量企业家被查,为这种不安全感提供了注脚。

4、中产下层的生存压力与焦虑情绪。与其他各阶层相比,在中产阶层中盛行焦虑情绪,突出地体现在办事人员阶层(图4)。办事人员阶层是典型的城市白领阶层,根据已有的大量研究,“白领”阶层的最为突出的情绪特征就是“焦虑”,这一判断在本研究中得到来自互联网大数据的支持(图4)。 “焦虑”、“焦躁”情绪来源于该群体的结构性位置与生存压力。

5、技术工人阶层更为愤怒,非技术工人挫败感突出(图4)。技术工人阶层是工人阶层的主体部分,这个阶层被认为是中国的领导阶层,建国之后,作为“工人老大哥”的技术工人阶层在很长的历史时期内具有非常高的社会地位。而伴随着市场化改革,工人阶层面临社会地位被迫下降、“同工不同酬”等社会歧视,这也会从总体上导致工人阶层的一系列负面情绪的产生。从生活压力的角度看,该阶层预期在城市立足生存,但是近年来房价如脱缰般的野马一样疯涨,在北上广一线城市买房立足已经是不可能,在二线城市同样需要支付天价房租,背负高额的房贷,以至于很多人自嘲为“房奴”。而对于没有买房子立足的群体而言,这样一种沮丧与愤怒将会来得尤为猛烈。

非技术工人是城市社会的底层,是靠体力获取收入维持生存的阶层,主要由农民工以及城市弱势群体(比如小摊贩、各种苦脏累的活、建筑工人等)构成。这是一个难以真正市民化的阶层,其中的绝大部分都因为无法在城市真正立足而不得不返回乡村或者继续沦为城市底层。挫败感作为其情绪体验的突出特征,或许与该阶层缺乏改变命运的机会、向上流动缺乏空间有关,在个人奋斗却难以改变命运的过程中,挫折感与失败感的产生是必然的。

(四)社会情绪的阶层分化机制

精神健康社会学认为,人类的负面情绪主要与生活压力有关,这种压力可以是来自各方面的,比如说生存压力、工作压力等等。以失业这一压力性生活事件为例,失业导致慢性经济压力,进一步导致个体自尊与自我效能感的降低,这种自我概念的变化最终将反应为个体抑郁情绪的上升。下面我们结合前文介绍的压力-过程模型,对综合情感指数的阶层分布,以及在中国社会中普遍流行的负面情绪的阶层分布进行回归分析。

(1)风险与压力暴露的阶层差异。“天有不测风云,人有旦夕祸福”。社会生活中存在大量的危机性情境,这是一个客观事实。风险的发生,会中断人们的正常生活,或者造成人员伤亡、财产损失,或造成生活不便、情感受伤,故而,作为一种反常的生活状态,风险性情境会唤醒不安、悲伤、恐惧等负面情绪。然而,正如社会学家乌尔里希.贝克所言,风险的暴露并不是均匀地在社会各个阶层分布。与财富向社会上层聚集相反,社会风险是向社会下层集中的。

本文从大数据的角度证明了这一判断:即各种生活压力的阶层分布,都呈现出明显向下层集中的特征,底层的农民阶层、非技术工人阶层以及工人阶层,在各种生活压力上的暴露指数要远远高于上层和中上层(见表2)。

首先,我们将社会生活中的压力归纳为6个方面:天灾(自然灾害)、人祸(人为灾害)、贫困、失业、社会冲突、以及各种危机性情景。显然,对于公众而言,只要暴露于上述任何一种压力,都会中断正常生活,产生精神压力,进而影响精神健康。上述6个方面的压力涵盖了社会生活中最主要的压力类型。

其次,我们结合GDELT数据库,将上述6个方面的压力信息从GDELT数据中提取出来。具体做法是,GDELT数据库根据自然语言处理和概率主题模型算法,从超高维的层面对文本中的信息进行提取,GDELT数据库目前可以提取的主题信息包含53165种类别,几乎涵盖了人类社会生活中绝大部分社会现象。也就是说,GDELT可以从53165个维度,对一个文本个案中包含的信息进行提取,对于任意一个文本案例,通过自然语言处理可以识别该案例是否包含了某一个主题的相关信息,这样就可以形成53165个0/1变量,透视这一个文本案例。

本研究所需要的上述6个方面的压力信息,全部包含在这53165个主题中。以人为灾害为例,GDELT数据库中目前已经识别出包括交通事故、出轨、房屋着火、建筑倒塌、桥梁坍塌、瓦斯爆炸、管道爆炸等120种类型,这样就相应地形成120个有关人为灾害的0/1变量。很显然,我们不可能对120种人为灾害的阶层分布都一一列举,而是根据主成分分析方法,对这120种人为灾害的信息提取主成分,以最主要的因子作为人为灾害暴露指数,然后进行阶层比较。其它压力暴露指数的计算方式类似,分析结果见表2[21]。

表2显示:在6项压力指标上,处于相对底层的农民、非技术工人、技术工人阶层,其暴露指数远高于上层和中层。故而,研究假设2关于压力暴露的阶层分布假说得到检验。

表2 各阶层的压力、风险与危机暴露指数比较[22]

阶层

自然灾害暴露指数

人为灾害暴露指数

危机暴露指数

冲突暴露指数

失业风险指数

贫困暴露指数

官员

-0.10

-0.05

-0.09

-0.21

0.169

-0.033

企业家

-0.19

-0.09

-0.32

-0.23

0.190

-0.003

知识分子

0.01

-0.04

-0.07

-0.01

0.144

-0.129

技术人员

-0.11

-0.01

0.02

-0.12

0.162

-0.076

小业主

-0.13

-0.08

-0.16

-0.26

0.215

-0.049

办事人员

-0.06

-0.03

0.03

0.14

0.194

-0.022

技术工人

-0.02

0.07

0.09

-0.04

0.278

0.041

非技术工人

0.01

-0.02

0.19

-0.03

0.306

0.041

农民

0.54

0.70

0.31

0.14

0.233

0.574

(2)风险与压力易感性的阶层差异。压力-过程模型不但强调分析压力暴露因素,而且还分析面临压力时,易感性机制对于负面情绪唤起的阶层差异。那么不同类型的压力与风险,对不同阶层的负面情绪唤起程度是否存在显著性差异呢?

表3 不同阶层的压力易感性比较(OLS回归)

压力因素

压力因素对各阶层消极情感指数的影响系数(Beta)

压力因素对各阶层积极情感指数的影响系数(Beta)

下层

中层

上层

下层

中层

上层

冲突暴露指数

.482**

.437**

.357**

-.136**

-.130**

.002

危机暴露指数

.465**

.258**

.239**

-.167**

-.095**

-.010**

贫困暴露指数

.160**

-.013

-.022

-.108*

-.023

-.060

人为灾害暴露指数

.062

.029

.022

-.080*

-.101*

-.132*

自然灾害暴露指数

.079

.076

.014

.011

-.058

-.139**

失业风险指数

.122**

.059*

0.008

-.090*

-.051

-.064

模型拟合度:R squre

0.684

0.579

0.597

0.293

0.270

0.211

注释:分别以消极情感指数、积极情感指数为因变量,以6种压力与危机暴露指数的自变量进行回归分析,上表列举的是回归方程在不同阶层中运行时得出的不一样的回归系数,通过比较不同阶层中回归系数的大小,测量6种压力对不同阶层的总体性情绪指标的影响,进而比较这些压力在不同阶层中的影响力度。**,*分别表示回归系数的显著性为P0.1和P0.05.

数据分析结果大致证明了压力易感性的阶层差异。面对同样的风险与压力,下层的负面情绪易感性高于中层、上层,压力与风险在唤起不同阶层的负面情绪时,效应系数不一样。表3显示:所列举的6种压力因素中,在不同阶层,对积极情绪、消极情绪的作用机制与力度是不一样的。在所列举的6项压力指标中,冲突暴露指数、危机暴露指数、贫困暴露指数、失业风险指数等4项指数对底层的负面情绪的激化效应和对正面情绪的消减效应,都明显超过上层和中层。而剩下的人为灾害暴露指数和自然灾害暴露指数,即天灾人祸在上层的易感性更强,这个分析结果与研究假设2略有出入。

综上:压力过程模型的阶层暴露差异以及易感性差异已经大致被证明。首先,6项压力指数在底层的暴露水平明显高于上层,压力暴露的阶层分布假说成立;其次,在6项压力指数中,有4项指数符合压力易感性的阶层分布假说,即冲突暴露、危机暴露、贫困暴露、失业风险暴露这四个因素在底层不但暴露程度更高,而且对于激化底层的负面情绪、消减积极情绪方面的力度也更强,故而危机暴露的阶层差异机制与易感性的阶层差异机制同时发挥作用。而剩下的自然灾害和人为灾害暴露指数则主要以压力暴露机制对情绪状态的阶层分化发挥作用,易感性机制作用于研究假设不符合。

五、阶层互动、场域与情感氛围

一般而言,新闻案例中的事件,很少只涉及到一个阶层,而往往有多个阶层同时出现,这时,这个事件实际上就是两个或者多个阶层之间的互动,或者说两个阶层遭遇时的场景。如果事件中涉及到2个或多个阶层,那么它反应的是与这些阶层有关的互动场景。这种互动,可以是冲突、合作,也可以是群体性事件,具体的互动类型涵盖了各个阶层之间所有的互动类型,而互动的结果,往往会伴随一定的结果与情绪体验,这种情绪体验不是一个阶层所体验的,而是两个阶层或者多个阶层互动情境中的情感氛围。

在微观个案层面,这种阶层互动的情感氛围随机性非常强,阶层互动场景多种多样;但是将这些海量的情境汇聚起来,对场景进行结构化,按照阶层之间互动类型,对这些海量个案进行分类,然后看不同阶层互动时的情绪氛围的总体状况,并据此折射当前的阶层关系状况:如果阶层互动更多地是合作、友好、融合,那么这种阶层互动类型下积极情感指数就会相对更高,如果阶层互动更多地是冲突、对立与排斥,那么这种阶层互动类型下的消极情感指数就会更高。

我们对中国社会各阶层之间互动的“情感氛围”以矩阵的形式反应出来,借此透视中国社会各阶层之间的关系(见表4)。

表4 中国社会阶层互动“情感氛围”矩阵

官员

企业家

知识分子

技术人员

小业主

办事人员

技术工人

非技术工人

农民

官员

0.47

-0.04

0.22

0.21

-0.22

-0.05

-0.09

-0.20

企业家

0.47

0.05

0.34

0.34

-0.01

0.17

-0.02

-0.18

知识分子

-0.04

0.05

0.54

0.29

-0.10

0.29

-0.15

-0.34

技术人员

0.22

0.34

0.54

0.66

0.33

0.58

0.33

0.70

小业主

0.21

0.34

0.29

0.66

2.60

0.46

-0.14

-0.74

办事人员

-0.22

-0.01

-0.10

0.33

2.60

-0.83

-0.57

-0.36

技术工人

-0.05

0.17

0.29

0.58

0.46

-0.83

-0.19

-0.93

非技术工人

-0.09

-0.02

-0.15

0.33

-0.14

-0.57

-0.19

-0.24

农民

-0.20

-0.18

-0.34

0.70

-0.74

-0.36

-0.93

-0.24

注:表格中的数据为综合情感指数。


(一)官员阶层与各阶层互动的情感氛围

官员阶层是中国社会极为重要的阶层,那么官员阶层与其他各阶层互动情境的情感氛围呈现怎样的特征呢?表4显示,官员阶层与上层企业家、知识分子,中层的技术人员阶层、小业主阶层的关系总体缓和,而与中下层的关系普遍紧张,其中尤其以官员与办事人员阶层、官员与农民阶层的紧张关系更为明显。

这里最有趣的现象或许在于,官员阶层与企业家之间的互动,其综合情感指数远高于官员阶层与其他阶层。这其中的逻辑大致在于,官员阶层控制权力资源,而企业家阶层控制财富资源,这两大精英阶层之间资源交换与合作空间,远远超过其他阶层关系,密切的资源交换与合作,维系着这两大阶层之间的“友好氛围”。这一分析结果与已有研究中有关“精英结盟”的判断如出一辙。

表4还显示,官员阶层与农民阶层关系也比较紧张,即所谓“官-民冲突”。官员与农民的冲突,是国家与农民关系的一种表现形式。政府与农民关系最为紧张的时期可能是农业税费改革前夕,在“收粮派款”、“刮宫引产”的时代,乡镇官员与村干部在收取农业税费和实施计划生育政策时与农民的矛盾非常激烈,各地群体性事件此起彼伏,形成了所谓的“治理性危机”[23](李昌平,2000)。

而农业税费改革之后,基层政权悬浮,国家与农民关系发生历史性变迁,那么国家与农民关系是否得到改善呢?从阶层比较的角度来看,我们发现官员与农民之间的紧张关系,依然是阶层关系紧张的主要表现形式。近年来,政府与农民的冲突,可能不再是源于计划生育与收取农业税费,而是城市化进程中的由地方政府推动的征地拆迁,以及为了获取建设用地指标的各种“圈地运动”,比如整村推进、农民上楼等。已有大量分析显示,暴力拆迁引发大量官民冲突,引发的群体性、抗争性事件不计其数。这些冲突性事件是当前引发官-民关系紧张的主要原因,官-民冲突应该也主要发生在上述场域。

(二)企业家与各阶层互动的情感氛围。从互动情境情感指数来看,企业家阶层与上层、中上层关系总体良好,而与底层的关系总体紧张。企业家阶层与官员阶层互动的情感氛围最好,企业家与技术人员、小业主的关系都还不错;而企业家与非技术工人阶层、农民阶层之间的互动关系总体紧张。企业家与不同阶层互动场域的这样一种情感氛围,耐人寻味,总的来说,反应了这样一个规律:企业家与同样掌握稀缺资源的强势阶层之间更多的是合作共赢关系,而与弱势阶层之间的紧张关系,则反应企业家与这些阶层之间更多的是一种冲突性关系。

比如说,企业家阶层与工人阶层之间是雇佣-被雇佣关系,存在劳资冲突等各方面问题。同样,企业家阶层与农民阶层之间也是一种紧张的交换关系,这体现在资本下乡等极容易引发冲突的互动场景中。

(三)中国社会阶层互动情感氛围矩阵分析。从阶层之间互动的情感氛围矩阵来看,阶层互动的情感氛围呈现出如下特征:上层(官员、企业家、知识分子)各阶层互动场景中的情感氛围总体上呈现积极态势,而上层与中下层(办事人员、技术工人)、上层与底层互动时则更偏向消极情绪氛围;中产阶层,除了办事人员阶层之外,其他三个阶层与上层互动时偏向积极情绪,与底层互动时则明显偏向消极情绪;非技术工人与农民阶层和其他各阶层的互动情景明显偏向消极负面。

阶层之间互动场域的情感氛围,大致能够反映目前中国社会各阶层之间的关系状态,中国社会结构目前呈现出来的特征是,上层与中上层的关系总体和谐,以积极正面为主,而上层与底层则关系紧张。中层与其他各阶层的关系总体缓和。这其中的逻辑大致在于:

第一,中国社会各阶层之间,阶层关系紧张的压力来源于底层,底层生存状况的恶化,激化了底层与上层、中上层的矛盾。而底层的生存压力和各阶层之间的紧张关系,则来源于上层对底层的社会排斥,以及高居不下的财富两级分化。

第二,中层与上层和下层的关系有所不同。技术人员阶层与其他各阶层之间的关系普遍较好,小业主阶层与底层冲突较多,与上层关系积极良好;办事人员阶层则与上层和底层的关系都比较紧张,而与中层的关系相对较好。

第三,中国社会的精英阶层之间关系相对“融洽”。已有研究也表明,作为既得利益阶层,中国社会上层已经形成利益共同体,权力、经济、文化精英不但形成利益联盟,而且存在富有中国特色的不同领域的精英跨界流动的现象[24]。

六、总结与讨论 (一)社会情绪阶层分化的主要内涵

本研究发现,社会情绪的阶层分化,既表现在总体性情绪指标上,也表现在具体性情绪类型的差异上。伴随着财富向上层集中,社会风险向下层集中,抑郁、怨恨、绝望等负面情绪具有向下层聚集的趋势,社会上层、中产上层的积极情绪指数明显高于下层。社会情绪的阶层分化是社会转型与社会两极分化的必然结果。党和国家应该对社会情绪的阶层分化高度重视,并扭转这种趋势。我们的分析还发现,不同阶层中突出性负面情绪问题差异明显,在情感治理的进程中,应该结合不同阶层所存在的突出性情绪问题,不同情绪的具体形成机制进行分类治理。

负面情绪的阶层分化,一方面与风险与压力暴露的阶层分布有关,底层更多地暴露于风险与压力事件中;另一方面也与负面情绪的易感性的阶层差异有关系,更低的社会经济地位的阶层与高社会经济地位的阶层相比,更容易被不良事件影响情绪,较低社会地位的阶层面对所有类型的压力事件都表现出了更高的易感性。这样,压力与风险暴露机制和易感性机制的阶层分布叠加在一起,构成了社会情绪的阶层分化景观。

(二)不同的阶层互动场景中的情感氛围差异显著

上层精英阶层之间互动场域中的情感氛围相对和谐,而上层与底层、中层与底层互动的场域中情感氛围则相对紧张。精英之间更多的是资源共享与相互联合的关系,而官民、劳资等阶层互动关系中则相对紧张,阶层互动中更容易产生冲突性事件。这些分析结果基本上与社会学研究中有关“精英结盟”的判断相契合。

(三)本文在研究方法上的创新与不足

正如所有类型的大数据应用于社会科学研究领域中可能存在 “数据偏差”一样,借助于GDELT数据库反应各阶层的情感状态与阶层互动的情感氛围,可能也存在研究结论的效度问题。如何解决这个问题,一方面,需要对数据的属性进行研究,另一方面,需要对大数据与小数据的分析结论,以及不同来源的大数据的分析结果的一致性等进行分析,进而对研究结论的稳健性做检验。

首先谈谈数据属性。GDELT数据库主要由主流媒体、网络新闻、网络论坛等不同来源信息构成。那么该数据是否适用于分析中国社会的阶层以及情绪状态呢?

从数据的属性来看,媒介数据,无论是社交媒体数据,还是门户网站与网络新闻数据,都是一种“拟态真实”。拟态真实指的是人们通过符号系统对现实环境的一种描绘、摹写、重构和再现,它以现实环境为蓝本,运用符号系统在媒介上构建出反映现实环境的信息,形成一个符号化的信息环境。

在媒体高度发达的社会条件下,媒介所建构的拟态环境越来越接近真实环境。在web2.0时代,媒体已覆盖和渗透到现代社会生活的方方面面,成为人们无法离开的必备工具,快速、高效、便捷的媒介手段不仅可以为人们实时提供真实环境的动态信息,而且这种媒介所建构的拟态环境越来越接近真实环境,可以使受众具有身临其境的现场感。除了拟态环境对现实环境的拟真度越来越高、构建拟态环境的参与面越来越广外,拟态环境对现实环境的作用也越来越强。拟态环境与现实环境之问的关系也处在不断深化,表现为拟态环境的现实化。“拟态现实”在客观、真实、能动地反映现实环境的基础上,对现实环境发展变化又起着引导、转化和塑造作用[25]。

正是基于上述考虑,本研究认为,一个具体的新闻案例充满了建构性、选择性以及媒介框架的运用,但是对于海量的个案数据而言,因为信息来源多种多样,表述者的类型多种多样,以及媒介高达发达,这使得在较长跨度的历史过程中积累的数据与现实生活越来越接近,故而通过GDELT数据库在反应现实生活方面,具有较强的可行性[26]。这方面,大数据与小数据的结果比对,以及不同来源的数据的结果比对,为这一判断提供了注脚[27]。


[①]陆学艺,《当代中国社会阶层的分化与流动》,《江苏社会科学》2003年第4期。

[②]马广海,《存在、认同与冲突:转型期我国社会的阶层意识概览》,《山东社会科学》2011年第5期。

[③]刘欣,《转型期中国大陆城市居民的阶层意识》,《社会学研究》2001年第3期;陈云松,《阶层自我定位、收入不平等和主观流动感知(2003-2013)》,《中国社会科学》2016年第12期。马广海,《存在、认同与冲突:转型期我国社会的阶层意识概览》,《山东社会科学》,2011年第5期。张文宏,刘永根,《社会分化、生活体验与阶层冲突的主观建构》,《社会科学战线》2017年第1期。

[④]翁定军:《阶级或阶层意识中的心理因素:公平感和态度倾向》,《社会学研究》2010年第1期。

[⑤]成伯清,《心态秩序危机与结构正义:一种社会学的探索》,《福建论坛.人文社会科学版》2016年第11期。王鹏,《情感社会学的社会分层模式》,《山东社会科学》2013年第3期。柯林斯,《仪式互动链条》,Collins., Interaction Ritual Chain, Princeton: Princeton University Press,2004, P.108。

[⑥]成伯清,《从嫉妒到怨恨》,《探索与争鸣》2009年第10期;王俊秀,《警惕群体性怨恨成为“社会心病”》,《中国教育报》2012年1月11日;马广海,《从群体性事件看转型期社会心态》,《中国海洋大学学报社会科学版》2012年第6期;王佳鹏,《羞耻、自我与现代社会》,《社会学研究》2017年第4期;杨宜音,《浮躁怎样成为一种社会心态》,《江苏行政学院学报》2014年第6期;周晓虹,《中国社会心态危机蔓延》,《人民论坛》2014年第9期;李春玲,《中国中产阶级不安全感和焦虑心态》,2016年第4期。

[⑦]王俊秀,《社会心态理论》,社会科学文献出版社,2014。

[⑧] 参见兰德尔.柯林斯,《仪式互动链》,林聚任等翻译,商务印书馆,2016.北京。特纳、斯黛兹著,孙俊才、文军等译,《情感社会学》,上海人民出版社,2007,178-179。

[⑨]刘欣,《协调机制、支配结构与收入分配:中国转型社会的阶层结构》,《社会学研究》2018年第1期。

[⑩] Jean-Baptiste Michel etc,Quantitative Analysis of Culture Using Millions of Digitized Books,Science14 Jan 2011:Vol. 331, Issue 6014, pp. 176-182DOI: 10.1126/science.1199644.

[11] 对数据库感兴趣的读者可以访问如下网址: https://bigquery.cloud.google.com/table/gdelt-bq:full.events。

[12]“语言获得与词汇计数程序” 能够在线测量网络文本信息中的数十种情绪和行为维度,包括积极、消极情绪,以及焦虑、愤怒和行为抑制等方面。

[13] 通过机器学习与自然语言处理提取文本等非结构化数据中的主题和情感信息,目前是计算社会科学领域的主流做法,具体可以参见Scott A. Golder and Michael W. Macy,Diurnal and Seasonal Mood Vary With Work, Sleep, and Daylength Across Diverse Cultures,Published 30 September 2011, Science 333, 1878 ,DOI: 10.1126/science.1202775.

[14] 李路路、朱斌,《当代中国的社会流动模式及其变迁》,《中国社会科学》2015年第5期。

[15] 这一操作是本研究得以进行的关键。本文正是结合了社会分层中通过职业进行社会分层的相关领域知识,第一次在社会学研究中,将阶层的概念在大数据的语境下进行了操作化。对操作化方案有兴趣的读者可以直接向笔者索取相关分析结果。

[16] 关于这20种危机的类型,具体内容请参见A. Olteanu, C. Castillo, F. Diaz, S. Vieweg.CrisisLex: A Lexicon for Collecting and filtering Microblogged Communications in Crises. In Proceedings of the AAAI Conference on Weblogs and Social Media . AAAI Press, Ann Arbor, MI, USA, 2014;以及https://blog.gdeltproject.org/crisislex-taxonomies-now-available-in-gkg/。

[17] 沙莲香主编:《社会心理学(第二版)》,中国人民大学出版社2006年版。

[18] 表1中tone的那一列,其中三个数据分别是综合情感指数、积极情感指数和消极情感指数。

[19] WordNet Affect 1.1根据文本的内容,对文本中含有情绪色彩的语义信息进行提取,故而这种提取不仅仅是情绪状态,还包含那些蕴含情感色彩的社会行动与肢体语言等等。WordNet Affect 1.1涉及到对150种左右的消极情绪和130种左右的积极情绪的识别,限于篇幅,本文主要展示各阶层的消极情绪。

[20] 全球内容分析系统GCAM系统通过一系列领先的内容分析工具来运行由GDELT监控的每篇新闻文章,以捕获超过2,230个潜在维度,这些维度主要涉及到情绪、心态、以及其他维度。使用GCAM,可以通过语言查询和词语计数系统(LIWC),WordNet、回归图像词典“Passive”等共计18个内容分析系统所提取的信息!有关GCAM字段的文件格式以及如何使用它的更多详细信息,请参阅GCAM主代码簿以获取可用的所有维度列表和全球知识图2.0代码簿。

[21] 对具体编码规则感兴趣的读者,可以参考GDELT数据库中概率主题模型的提取文件说明。也可向作者提取。

[22] 表中6项压力指数的计算都达到因子分析对提取主成分的基本要求,最大公因子的载荷都具有理想的表现。限于篇幅,在此不展开。

[23] 李昌平,《我向总理说实话》,光明日报出版社,2000。

[24] 成伯清,《心态秩序危机与结构正义:一种社会学的探索》,《福建论坛.人文社会科学版》,2016年第11期。成伯清认为,当代中国的精英阶层、包括政界、商界、学界和媒体界中所谓的“成功人士群体”,因为不同资本类型之间的流通与转化,各界“成功人士”的跨界成为时尚,实际上他们构成利益均沾的精英联盟。

[25] 曹劲松.论拟态环境的主体建构[J].南京社会科学,2009

[26] 实际上,迄今为止,所有的社会科学数据,无论是问卷数据,还是田野调研与档案文献,都是对客观真实中的一种选择性提取与建构,数据信息都是现实生活中的一部分,源于现实而高于现实,信息采集本身充满了研究者的建构与干预,而不可能是现实生活的全部或者与现实生活完全一致。媒介大数据尽管也是一种拟态真实,但这多源异构、海量、动态、长时期的数据而言,新闻文本中微观个案的随机性因素会被海量信息所稀释,在这点上,大数据与问卷调查由单一研究者建构的逻辑有所不同。

[27] 这方面,笔者将有专文报告。

您看到此篇文章时的感受是:
关闭】【顶部
>>相关文章
热点图片
推荐信息