大数据分析 560万Facebook人际关系数据

编辑:光环大数据 来源: 互联网 时间: 2017-11-20 17:52 阅读:

当你走出校门迈向职场,择业时也许很难完全避免来自父母的影响。而这种影响甚至还不是一时,而是打你一出生就已经开始了。

  

“龙生龙凤生凤”,父母的职业在多大程度上会影响子女的职业呢?Facebook的两位数据科学家通过分析Facebook社交平台上的数百万条职业和人际关系数据,为我们揭示了父母和子女的职业代际传承关系的“真相”。

 

  

子女选什么职业,多大程度上受到父母的影响?

  

父母和子女间的关系不只限于基因。父母是孩子的榜样,会为他们提供机会,还会为他们的职业道路提供建议。那么,孩子最终会和父母从事同样的工作吗?其他的兄弟姐妹也会选择一样的职业吗?不同的职业,父母对孩子的影响会有什么不同?

  

为了弄清这些问题,Facebook凭借自己的社交大数据对这一现象进行了研究。

  

Facebook分析了移除身份信息后的两组相关的数据:

  

兄弟姐妹的职业选择

  

父母子女的职业选择

  

样本包括了英语语言区在Facebook上关联了各种家人、亲戚关系的这些人,当然这些人也都填写了自己的职业,但需要注意,这些信息都没有经过验证。

  

Facebook把各类职业划分为几个主要类别,其中军事职业类别存在重复的情况,因为这个类别同时包括了雇主身份、职业分类以及过往的服役记录,而其他工作分类只是基于选择的职业分类。

  

由于数据不包括那些无法在Facebook上勾选的职业,因此它可能并不代表整体人口,但瑕不掩瑜,研究本身还是很有趣的。

  

下面这两张图展示的是父亲和儿子、母亲和女儿的职业关联度情况:

 

 

 

  

根据图片来看,子女和父母选择同一个特定职业的可能性,确实因职业而异。

  

Facebook一共收集了560万份数据,这些数据都来自英语语言区,且父母和子女都填写了职业信息。Facebook先计算了在给定父母职业的情况下子女从事某一职业的概率,比如,一个律师父亲有一个医生儿子的概率是5%。然后,Facebook还计算出这一概率相对于其他行业的情况是个什么程度。结果发现,在这个案例里,法律从业者的儿子比其他行业从业者的儿子,从事医药行业的概率高4.6倍。

  


对学历要求较高的职业,父母子女间的代际关联度较高

  

在下面这张可视化网络图中,每个节点表示“职业-性别”的配对,蓝色表示男性,紫色表示女性,例如,标有science字样的紫色节点意思是“女性科学家”。

  

另外,职业标签都是缩写的。2个节点间的连线和箭头方向,表示父母是某一职业的小孩会在多大程度上选择另外一个职业(注:衡量的标准是和人群的平均水平的比较)。所有线条只有当比平均概率至少大2.5倍以上才会显示,线条越粗,意味着子女选择另个职业的概率更高。

 


 

  

通过这样的可视化网络,我们可以了解父母与子女职业之间的联系。比如说,从蓝色的military(军事、军队相关工作)和蓝色的protective service(安保类工作)间这条线可以看出,父亲在军队中工作的话,儿子比平均水平更可能从事安保类的服务(注:至少比平均水平高2.5倍以上)。

  

通过展示这样一个关系网,并且使用力引导布局算法(force-directed network layout algorithm)把那些代际关系比一般水平高很多的关系放在更靠近的地方,我们可以看到,在上图的左侧,那些需要更高学历知识的职业会聚集得更紧密;另一方面,相对低学历需求的职业在右侧。

  

尽管相对来说,一个孩子很有可能跟随父母的脚步,但绝对百分比可能还是很低的。比如你的父亲在军队工作,则你入伍的概率是普通情况的5倍,这听上去非常夸张,但其实如果看绝对值,父亲是军人的儿子中,每4个儿子只有1个会选择入伍,也就是25%而已。至于父亲从事农业、渔业、林业的,只有3%的子女继承了这个行业,但还是比总体水平高出了7.6倍。

  

母亲是白领或者行政人员的女儿里,有20%会从事同样的职业,但这只比一般概率大了两倍。另一方面,如果母亲是医护人员,那女儿有8.5%的几率同样成为医护人员,并且这是总体的3.75倍。

  

我们也能看到跨性别的职业“继承”,例如:科学家父亲有一个科学家女儿的概率是总体的3.9倍,而律师母亲的儿子也干这一行的概率是总体的6.6倍。

  

另外需要注意的是,由于家庭背景,孩子进入某些职业的可能性会非常小。比如说,对于父亲从事法律的人来说,他们进入到建筑行业、维修、维护行业的可能性只是平均水平的85%。

  

除了父母,兄弟姐妹也会影响你的职业选择

  

接下来我们来看看兄弟姐妹们会不会选择一样的职位?

  

兄弟姐妹们不仅有一样的父母,对于双胞胎来说,他们还拥有相同的基因。对于同卵双胞胎来说,他们有完全一样的基因,对于异卵双胞胎来说,从基因上来说,他们和兄弟姐妹们没有区别。但不管是同卵还是异卵,双胞胎都是从相似的环境中成长起来的,尽管随着家里孩子数量的增加,父母的教养方式可能会产生变化,比如一个家庭中,对老大的教育可能比较严格,对最小的可能比较宠爱。但我们一般认为双胞胎受到的教养方式还是接近的。

  

为了分析兄弟姐妹的职业,Facebook收集了237万份数据。数据对象都是美国的同性别兄弟姐妹,并且他们在个人资料中填写了职业信息。

  

Facebook把兄弟姐妹分成三组:

  

同性别双胞胎,

年龄相差不超过两岁的同性别的兄弟姐妹,

大样本中任意两个年龄相差不超过两岁的同性别人士。

  

他们将会比较这三组样本中从事相同工作的概率。不难看出第三组是参照组。

  

在第二组中,也就是年龄相差不超过两岁的兄弟姐妹间,有15%的几率选择同样的工作,这比第三组任意两个同性别同年龄的人选择相同工作的概率8.6%要高。但更惊人的数据是,双胞胎选择同样职业的概率是24.7%。

  

下面这些柱状图将这个结论按照职业和性别进行了更具体的细分。

 

 

 

 

  

如图,每条柱子有三种不同深浅的颜色。颜色最深最不透明的代表了基准线的概率。稍浅一点的代表了同性别的非双胞胎拥有相同工作的概率。最浅的代表了双胞胎拥有相同工作的概率。

  

第一张图是按照双胞胎从事同一类职业比例的大小来排序,第二张是按照兄弟姐妹间的大小来排,第三张是基准组。

  

总结来说,我们可以发现,来自一个家庭的成员倾向于选择相同的职业,特别是对于双胞胎来说。然而,绝大多数的孩子都还是选择了走自己的道路,选择与父母或兄弟姐妹不同的职业。

 

  大数据分析大数据分析师的培训,大数据分析培训哪家好大数据分析培训就业,就选光环大数据!

原创文章,转载请注明出处:光环大数据

 


大数据培训、人工智能培训、Python培训、大数据培训机构、大数据培训班、数据分析培训、大数据可视化培训,就选光环大数据!光环大数据,聘请专业的大数据领域知名讲师,确保教学的整体质量与教学水准。讲师团及时掌握时代潮流技术,将前沿技能融入教学中,确保学生所学知识顺应时代所需。通过深入浅出、通俗易懂的教学方式,指导学生更快的掌握技能知识,成就上万个高薪就业学子。 更多问题咨询,欢迎点击------>>>>在线客服

你可能也喜欢这些

在线客服咨询

领取资料

X
立即免费领取

请准确填写您的信息

点击领取
#第三方统计代码(模版变量) '); })();
'); })();