个性化阅读
专注于IT技术分析

开源对女性开放吗?

本文概述

在为女性开发人员设立srcmini奖学金之前发布了以下内容。为了支持奖学金申请者, srcmini还发布了一份指南, 帮助你进行首次开源贡献。

妇女在科技领域的代表性不足。这种认识并不新鲜。只要看看Facebook, Google, Intel, Slack等发布的数字。但是这个数字可能比这些报告所暗示的还要糟糕。

在最近的一次科技活动中, 我无意间听到了关于科技领域缺乏性别多样性的会谈。这个小组正在讨论这样一个事实, 即尽管女性占科技行业劳动力的30%左右, 但更高级别的工程团队很少有几个女性。

这次对话的一位参与者评论说, 这是因为男性开发人员通常比女性开发人员更有才华。小组中没有人反对。

嗯…

从srcmini的个人经验以及我在普林斯顿大学的工程经验(男性与女性的比例接近50/50), 我知道这是错误的。我曾与许多杰出的女性工程师合作, 担任过各种职位。但是这些数字似乎与我的经验不符, 特别是当你开始寻找更多的高级工程职位时。

解决这一差距很重要。为了多样性, 不仅仅是多样性。从统计学上讲, 如果男人和女人同样聪明, 那么在世界上最聪明的十个人中, 五个应该是男性, 五个应该是女性。因此, 如果你的团队的男女平衡不足, 那么你的团队可能不是最好的。

如果你的团队男女平衡不足, 那么你的团队可能不是最好的。

在一个完美的系统中, 多样性是一个概率结果。但这不是我们看到的结果。

在听完了这段谈话之后, 我想看一下数字以更好地了解软件团队建设趋势是否/在哪里出错。我在Google上搜索了软件工程各个技能水平的性别细分趋势, 但找不到很多东西, 因此我决定查看GitHub上的公开数据。我刮掉了5, 000个配置文件, 以获取名称, 关注者数量, 贡献数量和存储库数量。然后, 我使用开源程序包sexize.io找出每个配置文件的性别。

在第一批中只有很少的女性, 我不得不添加更多的数据以使简单的图表变得有意义, 因此我又刮掉了15, 000。

这是我发现的:

妇女对开源的开放程度如何?

开源对女性开放吗?

鸣叫

开源由男人主导

甚至在进行任何进一步分析之前, 很明显, 女性的比例非常低。在20, 000个个人资料中, genderize.io能够自信地确定15, 374个性别。其中, 只有6.0%(926)是女性。一旦开始研究用户活动, 差距就会变得更加严重。

让我们以10个贡献作为截断值, 以区分刚刚创建个人资料并可能进行了一些实验的用户与一个至少研究了开源项目或开始自己的用户之间的差异。结果:5.4%女性。

在我们的随机样本中贡献超过10个贡献的GitHub用户中, 只有5.4%是女性。

鸣叫

实际上, 如果我们根据用户的贡献数量将其划分为多个存储桶(每个存储桶中至少有1000个用户), 则女性用户的百分比会随着贡献的增加而降低。

开源对女性开放吗?2

GitHub上的女性人数不仅少于科技行业的性别多样性数字所暗示的人数, 而且随着用户活动的增加, 女性的百分比似乎也在下降。

我不断挖掘, 关注关注者数量和存储库数量的性别, 并观察到相同的趋势。在查看存储库数量时, 这一点尤其明显:

开源对女性开放吗?3

同样, 我们看到随着移动到存储库更多的存储桶, 女性的百分比下降了。

那么这是怎么回事? GitHub活动首先是否可以合理地指示编程专业知识? (我认为是。)有天赋的女工程师是否比男同工更不可能积极地为开源做贡献?这些结果是否又能说明女性工程师在技术行业进入/保留方面的问题?

为什么开源社区中的人数如此之少?

科技行业中的女性人数已经相当惨淡, 但在开源项目中甚至更糟糕。

先前的许多研究都集中在女性为什么不愿意从事与STEM相关的学科和职业的原因上。一些人得出结论, 对STEM学科普遍不感兴趣。其他人则认为, 妇女在受到家庭和老师的刻板印象后, 决定放弃从事STEM的职业。还有一些人指出缺乏榜样或多种原因的结合。

根据StackOverflow中的性别研究, “性别和STEM相关主题的问题已经研究了多年, 而且主要是从”为什么”女性不从事科学研究或职业的角度出发。迄今为止, 人们较少关注量化在线社区中妇女的现象和代表性(作为技术”用户”), 她们的参与程度以及是否可以在性别层面上发现差异。仅收集到有关特定社区如何积极劝阻妇女参与的轶事证据。”

但是, 当我们花大量时间关注为何追求STEM相关主题的女性人数减少时, 我们就不再关注另一个重要的差距:如果28%的CS硕士学位是女性, 那么为什么开源社区中的人数如此之多?降低?

在考虑此问题的答案时, 可以考虑以下几种可能性:

1.也许编程人才和GitHub活动之间并没有很强的相关性。

在技​​术行业中, 许多开发人员在职业生涯的早期就开始使用GitHub, 因为这是必须认真对待的前提。但是, 似乎很少有抱负的女性开发人员通过这种方式查看开源。这些数据是否可能全部是巧合, 对技术行业中才华横溢的女性软件工程师的数量而言, 意义不大?

我与srcmini的两位工程师Anna-Chiara Bellini和Bozhidar Batsov讨论了这个问题。 Anna-Chiara在各种学术和商业环境中拥有20多年的软件工程经验, 而Bozhidar在全球最活跃的GitHub贡献者名单中排名第98位。

双方都同意, 尽管活跃在GitHub上通常是工程专业知识的良好指标, 但事实并非如此, 相反, 他们提到他们认识很多根本不参与开源的优秀工程师。科技行业也对此表示同意, 许多公司在招聘过程中评估了GitHub个人资料(尽管这种做法似乎有很大的偏见, 考虑到我的研究结果, 这并不令人感到意外)。

GitHub的活动通常可以很好地指示工程专业知识, 但事实并非如此……大量优秀的工程师不在GitHub上。

鸣叫

Bozhidar认为, 开源贡献者通常是推动公司内部进行重大内部变革的人。安娜·基亚拉(Anna-Chiara)评论说, 为开源做出贡献需要很大的信心, 考虑到科技行业的热情好客历史, 她认为女性开发人员可能更难以克服。

当然, 此GitHub数据可能存在一些偏见(包括几乎25%的名字都不能自信地分为男性/女性)。

但是, Bozhidar, Anna-Chiara和我同意GitHub活动水平通常可以很好地指示编程专业知识。但是, 这些数据表明, 有才华的女性程序员倾向于选择终止(或从不开始)开源事业, 而转向其他选择的趋势。

2.科技公司报告中引用的数字包括非科技职位。

科技行业的许多公司都引用了25%至30%的女性雇员。但是, 这个数字可能会引起误解。这些较大的数字中的大多数-是的, 它们是较大的-包括技术角色和非技术角色。

当你开始研究担任技术职务的女性员工所占的百分比时, 这一数字甚至更低。

在Facebook, 有32%的员工是女性, 但只有16%的技术职位是女性。在Google, 整个公司中女性员工的比例下降了30%, 而技术职位则下降了18%。从事工程工作的女性比例从39%下降到18%。在我研究过的公司中, 英特尔的升幅最小, 从技术职位上的女性比例总体上从24.1%上升到19.4%。

因此, 即使许多公司吹嘘女性雇员的比例约为公司的四分之一甚至三分之一, 但担任技术职务的女性人数实际上要低得多。看来15%至20%的索赔更为准确。

但这仍然在科技公司从事技术或工程工作的女性百分比与为GitHub上的开源项目做出贡献的女性百分比之间仍然存在巨大差异。

3.女程序员正在离开科技行业。

如果GitHub上的活动与资历和专业知识相关联, 那么活跃的女性贡献者数量极低(与总体上女性贡献者相比甚至更低)可以用高科技行业女性工程师的惊人离职率来解释。

在加入科技行业的女性中, 有56%的女性在职业中期离开, 这是男性流失率的两倍。

鸣叫

开源对女性开放吗?4

如果科技行业无法留住超过职业生涯中期分数的女性, 那么她们也可能不会为许多开源项目做出贡献。

但是, 这条推理路线也引出了一个问题:资历与贡献之间的相关性是否真的成立?许多OSS的频繁贡献者都是相对较新的程序员, 他们试图为自己树立一个名字-那么该群体中的女性在哪里?

4.对于女性程序员, GitHub可能是一个不受欢迎的社区。

一位女性开发人员在评论有关科技领域女性的文章时说:”关于开源项目-我最近一直在考虑这一点。我实际上没有投入任何工作, 这无疑给我的职业带来了麻烦……我觉得这是我无法进入的圈子。但大多数情况下, 我担心成为公开项目中唯一的女性程序员的关注过多。鉴于在互联网上如何对待妇女, 这种恐惧似乎并不合理。”

安娜·基亚拉(Anna-Chiara)认为, 这种忧虑是女性工程师的共同主题, 尤其是在OSS方面。当我问她是否认为女性不太可能参与开源项目时, 她毫不犹豫地回答是。

安娜·基亚拉(Anna-Chiara)还提出了一种可能性, 即女性GitHub用户可能会尝试采用不分性别的名称或男性名字, 以确保他们会受到重视(请记住, genderize.io无法自信地确定大约四分之一的性别。配置文件已抓取)。

但是, 这并不意味着女性捐助者并不在那里。 Bozidhar提出了Exercism.io, 这是由Katrina Owen发起的颇受欢迎的项目, 有几位女性贡献者。他还提到了来自挪威的女性开发人员Bodil Stokke, 他在流行的开源贡献方面拥有极其悠久的历史。

安娜·基亚拉(Anna-Chiara)还建议, 如果一个项目在高层贡献者或领导者中有女性, 则女性开发商可能更有可能为此做出贡献。不幸的是, 与男性主导的项目数量相比, 女性主导的开放源码软件项目很难找到。

但是问题不仅仅是OSS。 “如果我想到了我在发展中认识的女性, 那与你在这些大公司听到的20%的差距相去甚远。我认为这个比例甚至不会接近10%。”安娜·基亚拉(Anna-Chiara)告诉我。 “对GitHub进行分析的结果并不令我感到惊讶。”

5.塑造技术行业的隐性偏见可能正在渗入GitHub。

埃里克·里斯(Eric Ries)指出了科技行业内在偏见的问题。即使系统中的个人没有偏见, 这些系统仍然非常容易变得有偏见。人们也有无意识的偏见, 这使问题更加复杂。

埃里克(Eric)在他的文章中使用了乐队的例子, 直到1970年代, 乐队主要是男性。人们认为, 男性表演者比女性表演者具有更高的音乐天分。但是, 一旦乐团开始在试音期间通过物理屏幕将音乐家与法官区分开来, 数字就发生了很大变化, 人们开始接受男人和女人在平均水平上表现均等的表现。

如果在技术行业的招聘系统中也出现类似的偏见, 这可能有助于解释我之前讨论的女性软件工程师所占的比例较小。而且, 如果雇用的女性软件工程师人数减少, 这些影响可能会渗入GitHub等开源社区。如果某人被拒绝担任全职编程职位, 他们可能会认为自己不那么有才华, 因此不太可能有信心为开源项目做出贡献。

这在哪里离开我们?

这是我想到的一些后续问题(还有很多其他问题):

1.这些数字如何随着时间变化?

目前, 越来越多的女性参与科技行业是一个备受关注的话题, 需要贡献力量的编码训练营的兴起应该会产生积极的影响, 包括在开源方面。这些讨论和各种新举措的效果如何?这些数字在3年前会是什么样? 5年前?一年后呢?

2.我们还能如何分析GitHub数据?

Anna-Chiara建议根据用户必须分叉的次数检查用户的性别细分, 以了解女性GitHub用户以某种方式尝试项目的频率。此外, 还有其他因素在起作用, 例如年龄组, 可能会影响我们的发现。开源在很长一段时间以来一直是科技行业的主食, 但是GitHub成立于2008年。

3.是否有很好的方法来查看哪些GitHub用户使用了假名?

如果使用假名的女性比例远高于GitHub总体上的女性比例, 那么这将很好地说明GitHub(在一定程度上以及整个技术领域)作为社区的受欢迎程度。

4.当你开始查看位置时, 这些数字会如何变化?

这是不完善的, 因为从理论上讲, 在GitHub上的交互是位置无关的。但是我们能从女性GitHub用户比例高于平均水平的国家的技术社区中学到什么吗?

以下是一些提高这些数字的想法(当然, 当然还有更多的想法):

1.可以改善流行的GitHub存储库的页面吗?

当我与Bozhidar讨论这个主题时, 他提到GitHub上的大多数项目/社区的领导者都非常耐心, 热情好客, 并乐于在项目的早期阶段指导新的开源贡献者。这似乎一点都不是常识(记住一位女性开发人员的上述评论, 她认为开源社区是” [她无法进入]一个圈子”)。

新的GitHub用户是否意识到存在这种指导和支持(假设它像他所说的那样普遍), 并且新用户会知道如何轻松地找到这种指导吗?是否可以对流行的GitHub存储库的界面进行改进以使其更加明显并使其更加受欢迎?例如, 如果流行的存储库页面包含正式的” Repository Mentor”角色, 则可能更清楚地欢迎到经验丰富的用户来回答任何问题。

2.发布更好(更普遍)的” GitHub入门”指南。

那里有很多文章可以教你如何通过使用pull / pushes, commit, branch等来使用GitHub, 但是在GitHub社区中进行交互的准则方面, 我发现几乎没有什么(如果你知道的话)任何, 请在评论中发布相关链接)。

根据你的技能水平导航GitHub社区礼节和最佳实践的方法指南可能有助于打破对开源做出贡献的恐吓和关注元素。这绝对可以鼓励更多有抱负的新开发人员参与。请继续关注srcmini这样的指南。

3.更多的指导可能会带来巨大的变化。

Bozhidar评论了参与该项目的开发人员的重要性, 这些开发人员愿意帮助新来的人开始基本任务, 而Anna-Chiara讨论了跳入一个项目并使你的工作受到批评可能是非常令人生畏的。似乎有很多工作可以做, 以使开源社区对包括女性在内的所有人都更加欢迎。请继续关注srcmini的倡议!

你对GitHub的结果感到惊讶吗?你认为它们是什么意思?

赞(0)
未经允许不得转载:srcmini » 开源对女性开放吗?

评论 抢沙发

评论前必须登录!