光环大数据告诉你哪种编程语言最令人讨厌
光环大数据(大数据培训的专业机构),为了衡量每个标签被人喜欢或厌恶的程度,我们将看看它出现在某人的“不喜欢”标签中的次数,除以它出现在其他人的“喜欢”或“不喜欢”标签(也就是提到过该标签)的总次数。50%的意思是喜欢与不喜欢该标签的人各占 ...
Python Hadoop 编程 操作系统 Ruby 编程语言
在Stack Overflow网站的找工作板块上,您可以创建自己的开发者Story来展示您的成就并促进您的职业发展。创建开发者Story时,您可以选择添加想使用或不想使用的标签:
这为我们研究数十万开发者的意见提供了一个机会。衡量一种语言的普及程度有很多种方法;例如,我们经常使用Stack Overflow访问量或问题查看数来衡量这些趋势。当他们有机会在简历中说明不喜欢什么时,这个数据集是找出人们倾向于不喜欢什么技术的难得的方法。(两年前,我在个人博客上发表过一些这样的分析,但是这篇文章采用了更新的数据集以及更多的可视化结果和探索)。
编程语言为了衡量每个标签被人喜欢或厌恶的程度,我们将看看它出现在某人的“不喜欢”标签中的次数,除以它出现在其他人的“喜欢”或“不喜欢”标签(也就是提到过该标签)的总次数。50%的意思是喜欢与不喜欢该标签的人各占一半,而1%意味着每有一个不喜欢它的人就有99个人喜欢它。我们从选择的编程语言(而不是平台像Android或库像JQuery)列表开始,所有这些语言至少在2000个开发者Stories中提到。
最令人讨厌的语言是Perl,Delphi和VBA,它们以优势把其它语言甩在后面。其次是PHP,Objective-C,Coffeescript和Ruby。我们团队肯定很高兴看到相对于喜欢R的人数来说,不喜欢它的人数是最少的。
如果您读过我们其他一些关于编程语言不断增长或萎缩的文章,可能会注意到那些有较少讨厌者的语言往往是快速增长的。在Stack Overflow上(之前我们已经专门探讨过Python和R),R, Python, Typescript, Go, 和Rust全是快速增长的且全是非常受欢迎的语言。类似地,大量萎缩的标签,如Perl,Objective-C,和Ruby,都是我们以前观察到的,是最快萎缩的标签。
我们可以通过比较每种语言的规模和发展与不喜欢它的人的百分比来检验这一点,橙色点代表最不喜欢的语言。为了使我们的分析与前几篇帖子保持一致,我们将统计数据限制在高收入国家(如美国,英国,德国和加拿大)。
通常,语言的增长率和它多久被讨厌有联系。在Stack Overflow traffic上,几乎每个超过3%stories提及的不喜欢的语言都在萎缩(除了十分两极化的VBA,它稳定或略微增长)。不喜欢者数量较少的语言――R, Rust, Typescript和Kotlin―都是快速增长的标签 (Typescript和Kotlin增长的太快,不得不被截断)。
一个突出的标签是函数式语言Clojure;几乎没人表示不喜欢它,但它仍然是较快速萎缩的(根据问题查看情况,它大约在去年才开始萎缩)。另一个例外是MATLAB,它萎缩,但没有多少人表示不喜欢它。这可能表明测量数据的局限性:虽然任何web开发者可能对PHP,C#或Ruby都有意见,但是不从事数据分析的人没有理由对MATLAB表达意见。(这可能也是R在“不喜欢”中很少被提及的原因。)
我们并不一定说,程序员不喜欢的标签会导致它们被抛弃。另一种可能性是,如果人们感到这种语言已经越来越不受欢迎,那么人们公开地表达他们的厌恶会感到很自在。可以想象,开发人员经常使用这个标签来记录他们曾经使用,但不会再使用的技术。这将导致自然而然地“被取代”技术最终在不喜欢的字段。
最不喜欢和最喜欢的标签以上分析仅考虑编程语言,不考虑操作系统,平台或库。整体而言,最不喜欢的技术是什么?为了我们有足够的数据来关注重要技术,我们将其限制在至少提到1,000次以上的技术。
最不喜欢的其中几个是Microsoft的技术,特别是Internet Explorer和Visual Basic,以及“Microsoft”标签(“Apple”也出现在这个列表,但没有那么糟糕。)对于大多数不喜欢Flash的人,这里算是一个好消息。较老的语言如COBOL,Fortran,和Pascal也在此出现。
值得强调的是,这并不是对该技术,其质量或受欢迎程度的指责。这仅仅是衡量哪些技术激起了一部分乐于公开分享这一点的开发人员的强烈的负面情绪。我们也观察那些最流行的技术,那些几乎没有人不喜欢的技术。(这次,由于非常喜欢的标签更常见,我们仅关注至少被提及10,000次的技术。)
Git可能是许多开发人员感到沮丧的来源(对我来说肯定是!),但人们很少在简历中承认这一点,由于它是开发者Stories中最偏爱的标签。R也出现在这个列表,但它并不是与数据科学相关的没有争议的语言;23000人喜欢机器学习,而且很少有人不喜欢。诸如Python-3.X,CSS3和HTML5之类标签可能表明,开发者很少指定他们不喜欢技术的特定版本(即使他们指定)。当然,在Stack Overflow上,jQuery一如既往地受欢迎。
极化的标签网通过把所有这些标签组成一个网络,我们可以把它们组成一个story。在最近的一篇文章中, Julia Silge展示了我们如何构建一个技术网来代表整个软件生态系统。如果我们根据对每个标签的不喜欢程度来对节点进行着色,我们可以了解生态系统的哪些部分更有争议性。
通过将开发者Story标签放置到子生态系统,该关系网表明了哪一类标签更容易被讨厌。被讨厌的标签主要集中在三个群落:Microsoft(以C#和.NET为中心),PHP(以及WordPress和Drupal)和移动开发(特别是Objective-C)。在操作系统集群中(右下),我们可以看到诸如OSX之类的操作系统,特别是Windows都有不喜欢的人,但是像Linux,Ubuntu和Unix这样的操作系统却没有人不喜欢。
竞争如果某人喜欢特定的标签,有没有什么标签,他们很可能不喜欢?我们可以使用出现在特定喜欢标签之间的phi系数来测量。(当计算这些相关性时,我们只考虑那些至少有一个不喜欢标签的人。)
这突出显示了软件生态系统的一些“竞争”:Linux和OSX vs Windows, Git vs SVN,vim vs emacs以及(我并不惊讶的)R vs SAS。大多数这些比较并不是“相反”的技术,而是反映了解决类似问题的两种方法。它们中的许多表明从以前流行的技术发展到更现代的技术(SVN由Git取代, XML由JSON取代, VB由C#取代)。这对于人们在简历上列出什么是有意义的;开发人员通常明确指出他们不愿意使用他们认为过时的东西。
结论我对“语言战争”没有任何兴趣,我也不会对用户分享喜欢或不喜欢的技术进行评价。对微软技术两级分化的看法会鼓励我分享我的个人经验。我是Mac和UNIX的终身拥趸,而且几乎所有的大学和研究所编程都围绕着Python和R。尽管如此,我很高兴加入一个.NET栈的公司,我很高兴我做到了――因为我热爱这个团队,产品和数据。我不代表其他人,但是我很高兴我从事于自己想做的工作,而不是那些我想避免的。
大数据+时代,大数据培训机构,就选光环大数据!
原创文章,转载请注明出处:光环大数据官网。
大数据培训、人工智能培训、Python培训、大数据培训机构、大数据培训班、数据分析培训、大数据可视化培训,就选光环大数据!光环大数据,聘请专业的大数据领域知名讲师,确保教学的整体质量与教学水准。讲师团及时掌握时代潮流技术,将前沿技能融入教学中,确保学生所学知识顺应时代所需。通过深入浅出、通俗易懂的教学方式,指导学生更快的掌握技能知识,成就上万个高薪就业学子。 更多问题咨询,欢迎点击------>>>>在线客服!