主页 > 要闻速递 >个体数据与社会科学研究

个体数据与社会科学研究

发布时间: 2020年01月06日 作者:
个体数据与社会科学研究

作为一个社会科学研究工作者,笔者经常听到这样一种观点,即「社会科学是不科学的」。原因也很简单,因为它无法像自然科学那样进行实验,从而精确的控制所有可能影响结果的因素。这个观点一定程度上是正确的,然而无法否认的是社会科学在分析技术和因果识别上在过去半个多世纪的时间裏取得了长足的进步。通过大量严谨的社会科学研究,人们对于很多社会现象的理解得到了显着的提高。而社会科学能够取得这些进步的一个重要原因在于社会调查数据─这个作为研究分析的基础部份,在收集技术上的也同时在进步,它和社会科学研究两者是相辅相承的。在社会调查裏又以个体数据(individual level data)最具有价值,同时也是最为普遍的数据收集单位。中国大陆、台湾等国家地区早已于1980年代开始收集个体数据用作社会科学研究,相比之下澳门对于个体数据收集仍然欠缺足够的重视。笔者希望借助这篇文章简略的讲解个体数据的重要性,以及它对澳门社会的意义,从而引起相关政府部门和学界的关注。具体而言,笔者将围绕以下三个部份展开论述:1) 什幺是个体数据?;2) 为什幺需要使用个体数据?;3) 个体数据和公共政策之间的关係。

什幺是个体数据?首先,我们知道数据的构成可以基于不同的单位,比如说个体、群体、城市甚至是国家。因此所谓个体数据,顾名思义就是指数据的收集或构成是以个体作为单位。在个体数据裏每一个个体都拥有一个与之对应的ID和一系列和这个ID相对应的变量信息,比如说性别、年龄、学历。在澳门由于个体数据非常有限,较为知名的大型社会调查可能只有前后进行了三次的「澳门特别行政区综合生活素质基準研究」(注1)。为了方便理解,我们可以把个体数据和澳门的人口普查数据作一个对比。人口普查数据称之为汇总数据(aggregate data),它是与个体数据相对的一种数据形式。人口普查数据虽然在收集时也是以个体(虽然抽样单位是住户)作为单位,但是由于在公布时已经把数据汇总,它所代表的单位就不再是个体,而是城市(注2)。因此,虽然我们仍然可以从人口普查数据裏获得性别、年龄、学历等变量的分布信息,但是这些信息不再和特定的个体ID对应,而只能够代表澳门这个城市裏的人口总体。

为什幺需要使用个体数据?

读者可能要问,使用个体数据或汇总数据在分析社会现象时会有什幺差别吗?这裏涉及到我们要讨论的第二个问题,即「为什幺需要使用个体数据?」。主要原因至少有两个。

第一,假如我们希望基于社会调查数据对社会现象的成因作出一些判断或结论,那幺这个判断或结论的有效性很大程度上受限于数据的收集单位。如果你的判断要推论至个体,而使用的亦不是个体数据,那幺你就可能犯了「生态学谬误」(ecological fallacy)。简单来说,就是以全概偏。举个例子,中国大陆的国营企业进行员工招聘时,人力资源部门经常会对求职者的学历进行某种限制以减少筛选简曆的工作量,比如说「只招清华北大」。我们知道清华北大都是名校,因此默认考进这两所大学的学生都拥有较强的个人能力是很自然的事情。然而两个学生可能高考分数就差几分,恰恰好一个够分上清华北大,一个只能上其他大学。在这样的情况下,两个学生之间在能力上可能并不存在本质差异。上述这种认为非名校学生能力不够的「成见」,其实就是一种「生态学谬误」,虽然它可能并不总是错误的。由于社会现象的最小单位通常就是个体,因此一个乎合随机抽样的个体数据可以反映总体人口的情况。相反,汇总数据则无法降维成个体数据,从而反映具有特定人口特徵的个体的情况。这是个体数据相比汇总数据而言,所具有的一个明显优势。

第二个原因则更为重要。社会科学研究并不仅仅满足于用社会调查数据来描述社会现象,对于研究者而言,他们更为关心的问题是解释社会现象的成因。这裏就涉及到对不同变量之间相关关係(correlation)、因果关係(causality),甚至是现象形成机制(mechanism)的探讨。而这样的分析只能够基于个体数据来进行。让我们仍然以大学教育作为例子。假设我们希望知道大学教育可以为学生带来多少工作收入回报。最严谨的分析方法是像自然科学一样做一个实验,在实验室裏克隆出另外一个自己,然后用抛硬币的方式来决定那一个「自己」可以上大学,而另外一个则在高中毕业后直接工作。在这样理想的实验状态下,因为能够控制所有可能影响实验结果的因素,因此只需简单把两个「自己」的工作月薪或年薪进行对比就能够知道大学教育的回报是多少。当然,在现实裏我们不可能进行这样的实验。因此取而代之的做法是,我们期望在统计模型裏尽可能控制影响收入回报的因素,比如说学历、工作经验、职业技能等。而在汇总数据裏,我们是无法进行这样的操作。事实上,人口普查裏只能给予我们两个群体之间的收入差异,但是我们根本无法知道这些差异是否真的是「上没上大学」造成。因此,容笔者再强调一次,要精确分析社会现象的成因,个体数据不可或缺。

个体数据和公共政策

最后一个问题,让我们回到澳门社会来讨论一下个体数据如何可以帮助澳门政府制订出更适当的公共政策。

公共政策本质上是一个由连续行为构成的,为了解决特定社会问题的过程。大多数公共政策的教科书会告诉你,公共政策大至可以分为以下几个阶段:问题确认(problem identification)、议程设置(agenda setting)、形成政策方案(policy formulation)、立法(policy legitimation)、政策执行(policy implementation)、政策评估(policy evaluation)。上述至少有两个阶段和个体数据有着紧密的关係。

第一个是问题确认。它是整个公共政策过程的起点,那是因为只有当一个社会问题被认为是一个「问题」时,它才可能进入到政府的议程裏面。举个例子,澳门自从2002年赌权开放开始,博彩业的蓬勃发展吸引了不少中学生选择放弃大学教育进入薪酬吸引的博企成为荷官。并不是没有舆论认为这可能对社会造成一定的负面影响。但是到底这些负面影响有多大呢?其中一个可能的负面影响是大学教育的缺失可能影响这些学生的长期收入回报,并且降低他们往上流动的可能生。假如拥有个体层面的数据,正如笔者之前提供的两个和大学教育相关的例子,我们可以放弃大学教育在个收入回报上的影响作一个估计。如果我们拥有一个长期的个体层面数据(也就是面板数据,panel data),我们甚至可以估计放弃大学教育机会对个体长期收入,比如说假如高中毕业后选择上大学而不是直接去当荷官,十年后两个不同的选择对个体的收入回报会有多大的差异作一个估算。进一步我们甚至可以估算大学教育的缺失是否降低了这些学生向上流动的可能性。因为经济学研究已经告诉我们在现代社会最重要的影响社会流动的因素就是教育。以上这些问题都可以透过个体数据来分析它们对个体生活的影响,从而让我们更好地认识这些社会问题,并透过适当的公共政策进行干预来处理其中的负面效应。

第二个则是政策评估。公共政策的目的归根究底是要解决社会问题,因此我们最关心的是政策是否达到了相应的效果,这就需要对政策的效果进行评估。比如说澳门政府为了鼓励市民自我增值,提升工作技能推出了「持续进修发展计划」。那幺假如有相关的个体数据,我们就可以评估计划对个体收入回报、职业选择和社会流动等各方面的影响。考虑到教育开支在近几年的财政预算中均位列前几名。假如计划没有达到预期的政策效果,根据量入为出的财政管理原则,相关政府部门就可能需要对该项政策进行调整。

结语

澳门社会在过去十年的快速发展后,社会经济结构均发生了相关程度的变化。而基于个体为收集单位的社会调查是準确了解这些变化的有效手段。个体数据将有助政府和学界对社会现象的成因的了解,从而製订出相应的公共政策,提升管治的效率。过往诸如「澳门特别政区综合生活素质基準研究」这样的社会调查无疑非常具有价值,因此应该予以持续进行并免费开放数据给学界和社会使用。亦唯有如此,对社会现象的讨论和分析才能更科学和理性,不同社会群体的才智资源才能有效运用,集思广益为建设一个更理想的社会和生活环境出谋献策。

注1:对于「澳门特别行政区综合生活素质基準研究」的具体抽样和数据收集方法,可以参考黄绍伦、杨汝万、尹宝珊、郑宏泰编:《澳门社会实录─从指标研究看生活素质》,香港:香港中文大学香港亚太研究所,2007,第323-330页。

注2:澳门人口普查的抽样方式可以参考澳门统计局网站提供的相关资料

作者简介:

澳门大学政府与公共行政系讲师。研究威权政治和中国政治。关注香港和澳门时事。电影和摇滚乐爱好者,偶尔写作影评和乐评。


上一篇:

下一篇:


菲律宾申博sunbet|申博管理网登陆网址|务川简讯网|网站地图