本文探索了在科研领域受到广泛认可的指标——“社会经济地位”(Socioeconomic Status,SES)在商业案例上的应用。并主要以CDC(腾讯用户研究与体验设计部,Customer Research & User Experience Design Center)与微保联合进行的《2018年互联网保险年度报告》(下文简称保险大调研)数据证明了SES用于商业研究中的用户分类是可行性。
用户画像阶段,用户研究童鞋必须要考虑的问题是:用哪些变量进行用户分类?
用户分类变量大致可以分为:业务变量和人口学变量。
本文要讨论的经济水平几乎是人口学变量中最常被用于用户分类的。
一、“收入”和“总资产”不足以描述经济水平
以CDC2018年进行的保险和购车调研为例:
我们在尝试对保险人群和融资租赁汽车用户进行分类时,不约而同地拿“收入”进行过探索。
但在不止这两个定性研究中,“收入”存在着不能完全描述一个人经济能力的问题,已知的一个原因是“收入”仅是影响经济水平的其中一个因素而已。
以极端个案为例:高收入白领可能家庭经济负担较重;低线城市X二代,可能到手月薪1000-2000,但是别墅、跑车。所以,仅仅以收入衡量经济水平远远不够。
其实,早在保险大调研的定性阶段就已经意识到单纯了解收入不足以描绘一个人的经济水平。
因此,我们详细地收集了构成全国5个城市76名用户总资产的各项指标,包括但不限于:房产等固定资产、股权期权、租赁收入、工资奖金、各种规模的投资等。
但当我们尝试用总资产量水平划分用户后发现:总资产的具体量级对用户的分类与我们的定性调研感知不符。
同样,定量研究阶段,将收入、总资产分别和业务指标组合输入二阶聚类,聚类质量均不高。
这是为什么?
——因为国内还存在着较大的地区间发展差异。
同样以极端个案举例:2018互联网保险调研接触到的用户包括两类——四线“土豪”;一线普通工薪阶层。
详细计算他们的总资产水平后,我们发现:在一线城市有房的普通工薪阶层总资产可能远远高于四线城市“土豪”。但他们实际的保险购买量,或是通过他们的保险意识判断未来保险行为,都和他们的总资产水平不成正比。总资产更高的一线工薪阶层并不比四线“土豪”在保险购买上有更高价值。也就是说,使用总资产来描述经济水平还是不够。
图1: 数据来源:CDC&微保《2018年互联网保险年度报告》,N=8626
为求更科学地在经济水平上对用户分类,我们还存在以下疑问:
- 考虑到地区间发展差异,应该怎样优化收入、总资产对经济水平的描述?
- 在定量研究阶段,如何操作化定义经济水平这个指标?
二、经济水平=社会经济地位
“社会经济地位”(Socioeconomic Status,SES):结合经济学和社会学关于某个人工作经历和个体或家庭基于收入、教育和职业等因素相对于其他人的经济和社会地位的总体衡量[1]。
社会经济地位(SES)的发展历程:
早在20世纪40年代,社会经济地位(SES)就引起人们的重视。在早期的研究中,学界还在探索社会经济地位由哪些指标构成。以基础医学为例:多采用可能构成SES 的单个指标和关注领域间进行探索研究,如收入与健康的关系[2、3]、教育程度和健康的关系[4]、职业类型[5、6]和健康的关系 。
又过了几年,Warner等人[7]曾进行过住房与社会经济地位间关系的探索。到了20世纪50年代,各研究领域逐渐达成了共识:社会经济地位指标由职业、教育水平和收入构成。
社会经济地位(SES)的3个构成指标被西方世界广泛接受后的80年来,社会经济地位(SES)的价值在各学科、各领域获得广泛的认可。同时,这一指标也被全世界范围内跨越种族和地区地接受(当然中国也包含在内)。
已验证社会经济地位(SES)有效性的研究领域:各种疾病、社会、文化资本、教育程度等[8]
图2
已验证社会经济地位(SES)有效性的学科:社会学、心理学、临床医学、基础医学、公共卫生与预防医学、理论经济学等[8]
图3
社会经济地位(SES)是否可以商业化应用?
2013年的巴西就存在着高收入集中的现象,也就是说收入曲线是负偏态化的,但许多产品类别的消费分布却更均匀(研究涉及的消费领域大到买房、个人教育,小到柴米油盐糖、水果、蔬菜、饮品、蛋白等)。也就是说,收入并不能预测各类产品的消费分布。
但研究发现:任何级别的社会经济地位(SES)与消费预算的人群占比均有明显的正相关或负相关(如下图)。因此,企业不应该只看到高收入人群的高占比就一味地将产品策略偏向高端市场,因为这会使市场的很大一部分留给竞争对手[9]。
图4
以上引用内容没有涉及SES指标计算方法的讨论,也只简略地概括了结论论证过程,有需要可以查看文末参考目录。
三、社会经济地位(SES)同样适用于目前的行业研究
社会经济地位(SES)已经受到了科研和部分消费领域的认可,它是否同样适用于目前的行业研究?
要验证SES对目前行业研究的用户分类是否同样有效,就要搞清楚怎样判断用户分类的质量。判断用户分类质量,有更多经验的同鞋肯定有更深刻的见解。但我们认为一个好的用户画像分类最基本要做到的是:在业务导向的维度上将用户分离开。
- 业务导向的维度:无论以哪些变量(下图6个坐标内的X轴)对目标用户群体进行切分,得到的用户分类结果必须是在业务导向维度上将用户分离开的(如下图最左侧的两个坐标系所示的情况最为理想,每一个输入即对应一个输出)。
- 分离开,翻译成统计学语言:无论使用了哪种分类统计方法(聚类、潜类别分析等),都可以通过评估类的分离情况来决定分类质量。也就是分类结果中类内越紧密,类间距离越大则分类质量越高。
图5 图片来自网络,侵权删除
以这样的标准,我们分别对两个项目进行了收入和社会经济地位(SES)在业务导向维度上分离情况的对比。
对比前,首先保证了结果的可代表性和控制变量:
- 为避免在指标的高低两级上出现样本量过少不具有代表性的情况出现,合并了社会经济地位(SES)/收入中样本量低于30的选项,结果社会经济地位(SES)绝对值低于7的情况被合并,收入则不需要合并。
- 将每一组坐标轴的Y轴测量范围统一。以图6为例,左右两图的Y轴均是用户占比,从10%到60%。
结论一
社会经济地位(SES)可以将用户在业务导向维度上分离开
例证1: 在业务员的依赖程度和互联网购险行为上,社会经济地位(SES)对人群的分类均呈现趋近正/负相关的情况。然而,收入对这两个业务相关指标并没有明显的预测趋势。
通俗地说,社会经济地位越高的保险用户越不依赖业务员,同时互联网购险比例越高。而这两件事情在收入上看不出明显趋势。
图6:数据来源:CDC&微保《2018年互联网保险年度报告》,N=8626
图7:数据来源:CDC&微保《2018年互联网保险年度报告》,N=8626
例证2: CDC美妆调研中,以美妆购买前是否比价为因变量,对比社会经济地位(SES)和收入。
结果发现:颜值当道的时代,人们普遍愿意为美妆投入。较低社会经济地位的用户更常比较产品价格,而中等及以上社会经济地位的用户对产品比较的动力均不足;较高社会经济地位的用户几乎不进行购买前的比价。同样,收入在这件事上没有显著的趋势。
图8:数据来源:CDC高端美妆调研,N=5697
结论二
将社会经济地位(SES)替代收入输入保险聚类指标中,结果发现:社会经济地位(SES)替代收入,显著提高了二阶聚类质量。
在详细对比了两次聚类的结果后发现:社会经济地位(SES)替代收入确实为用户分类提供了新的可能。
新结果的用户分类和之前基本一致(见图1),但四类用户在各指标上的差异增大,且分类指标重要性的排序发生改变,为用户分类提供了新的可能,这里就不在赘述具体发现。
图9:数据来源:CDC&微保《2018年互联网保险年度报告》,N=8626
四、为什么社会经济地位(SES)在商业应用中同样有效?如何应用?
社会经济地位(SES)的有效性除了学界已有的论证之外,这里想谈一谈为什么它会在商业研究中同样有效:
- 社会经济地位(SES)作为3个指标合成的变量,延伸了分类指标的指示范围。
- 相对于单一金额维度,社会经济地位(SES)为收入增加了锚定值:职业、学历。解决了不同城市间不可对比总资产的尴尬。
- 抚平了单个指标偏态化的影响。还是以保险为例,样本收入、学历和职业均呈现明显的负偏侧化分布,而这一偏态化的趋势在SES上不再显著。
图10:数据来源:CDC&微保《2018年互联网保险年度报告》,N=8626
向社会经济地位(SES)或用户画像分类探索感兴趣的同学做如下说明:
- 社会经济地位(SES)的计算单位可以是个人/家庭。
- 以个人为单位计算SES时,在职和在校的用户不能比较SES,因此使用SES指标的时候可能要分人群研究,或者用折中的办法将学生的职业定级为2(仅高于无业/退休),或者改为计算所在家庭的整体社会经济地位。
- 社会经济地位(SES)是否对每一个具体的个案有效,还有它在中国范围内的适用性都要视具体情况而定。
在本文上述的尝试中,我们使用的分类统计方法仅限于聚类,验证项目也还远远不足。
我们会继续基于可获得的数据做相应探索,也会依照国内最新研究精进各类业务/人口学指标,以期提高用户画像分类的解释力。希望有更多的个案联系到我们,或者拿自己探索的结果交流沟通,这也是这篇分享的初衷。
参考目录:
[1] National Center for Educational Statistics. 31 March 2008.nces.ed.gov/programs/co
[2] Cullumbine H. The health of a tropical people: a survey in Ceylon.III. Income and health[J]. Lancet, 1953,1 ( 6772) : 1193 - 1196.
[3] Gover M. Physical impairments of members of low-income farm families;11490 persons in 2477 rural families examined by the Farm Security Administration,1940; variation of blood pressure and heart disease with age; and the correlation of blood pressure with height and weight[J]. Public Health Rep,1948,63( 34) : 1083 - 1101.[4] Ayyagari P,Grossman D,Sloan F. Education and health: evidence on adults with diabetes[J]. Int J Health Care Finance Econ, 2011,11( 1) : 35 - 54.
[5] Shortell SM. Occupational prestige differences within the medicaland allied health professions[J]. Soc Sci Med,1974,8( 1) : 1 - 9.
[6] Smith AM,Baghurst KI. Public health implications of dietary differences between social status and occupational category groups[J]. J Epidemiol Community Health,1992,4 6( 4) : 409 - 16.
[7]Warner, W. L., Meeker, M., Eells, K., & Hall, O. (1951). Social class in america: a manual of procedure. American Journal of Sociology, 56(4), 366-368.
[8]百度学术-研究点分析
[9]Kamakura, W. A. ,&Mazzon, J. A. . (2013). Socioeconomic status and consumption in an emerging economy. Social Science Electronic Publishing, 30(1), 4-18.
形成文中对SES发展历程主要观点的文献也列在这里:
[10] Duncan OD. A socioeconomic index for all occupations. In A. J.Reiss ( Ed. ) ,Occupations and social status[M]. New York: Free Press, 1961. 1.
[11] Blau PM,Duncan OD. The American occupational structure[M].New York: Wiley,1967. 1.
[12] Kamakura, W. A. ,&Mazzon, J. A. . (2013). Socioeconomic status and consumption in an emerging economy. Social Science Electronic Publishing, 30(1), 4-18.
国内对社会经济地位进行本土化研究的例子:
[13]李春玲. (2005). 当代中国社会的声望分层——职业声望与社会经济地位指数测量. 社会学研究(2), 74-102.
[14]马玉霞, & 张兵. (2011). 社会经济地位测量方法的研究进展. 中国健康教育(5), 372-376.
谢谢阅读!
作者:腾讯CDC
来源:腾讯CDC
本文来源于人人都是产品经理合作媒体@腾讯CDC。
题图来自Unsplash, 基于CC0协议