数据分析师职业分析报告_数据分析师的行业环境-程序员宅基地

技术标签: python  

  • 分析背景及目的

        本次分析的数据源来自:lagou-数据集-和鲸社区,是一份数据分析师职业的招聘数据,数据集各个待分析字段的含义如下:

字段名

字段含义

positionName

岗位名称

companyShortName

公司名称

city

城市

CompanySize

公司规模

Education

学历要求

financeStage

融资阶段

industryField

行业领域

Salary

薪资

workYear

年限要求

hitags

福利1

companyLabelList

福利2

job_detail

岗位描述

  • 分析思路

        主要从岗位需求、薪资、技能要求三个角度来入手分析:

     1.岗位需求角度

  1. 不同城市数据分析岗位的需求量有什么差异
  2. 不同细分领域数据分析岗位的需求量有什么差异

     2. 薪资水平角度

  1. 不同城市数据分析岗位的薪资有什么差异,特别是四大一线城市的薪资水平分布有何差异
  2. 各城市工作经验与薪资的关系

     3. 技能要求角度

  1. 不同技能的数据分析岗位的薪资有什么差异
  2. 大公司对不同技能的要求占比有什么差异
  • 分析过程

     1. 数据预处理

  1. 数据去重:处理前后均为3140条数据,因此不存在重复值。
  2. 数据筛选:筛选出岗位名称中包含“数据分析”且不包含“实习”字眼的数据行,共1429条数据。
  3. 数据删除:删除掉多余的“岗位名称”数据列,并重新设置索引。
  4. 数据增加及格式处理:
    1. 将“薪资”数据列转换为整数类型并取信息区间平均值。
    2. 将“职位描述”数据列字符处理为小写并为缺失值赋值成空字符串。
    3. 从“职位描述”数据列中分别提取“Python/R”、“SQL”、“Tableau”、“Excel”软件技能字段,创建4个新数据列并分别赋值为1(要求相应的软件技能)或0(不要求相应的软件技能)。

     2. 结合图表分析

     1.从岗位需求量角度

[1] 分析不同城市数据分析岗位的需求量有什么差异

        从招聘信息的所在地来看,对数据分析岗位需求量较大的是北上广深四个一线城市,其中北京和上海分别位列前两位。除了北上广深和杭州外,其他热门城市的需求并不大,所以,如果想找数据分析相关的工作,最好去一线城市寻找相应的机会。

[2] 分析不同细分领域数据分析岗位的需求量有什么差异

        从不同细分领域的岗位信息来看,金融、电商和数据服务这三个领域的需求量位列前三位,其中电商和金融领域的需求远超过其它领域。像消费生活、企业服务和文娱行业等也有不少机会。

    2. 从薪资角度

[1] 分析不同城市数据分析岗位的薪资有什么差异

        从各城市的薪资水平来看,北京、上海、杭州、深圳处于第一梯队,月均薪水都超过了20k,苏州、南京、广州以及武汉位列第二梯队,月均薪水在15k左右,其他城市则处于第三梯队。(其中的黑色长条代表置信区间,该图表示95%的职位所对应的薪资在此区间范围内)

[2] 进一步分析四大一线城市数据分析岗位的薪资分布差异

        从四大一线城市的薪资分布来看,北京的薪资情况最为乐观,深圳和上海的分布较为接近,广州大部分职位的薪水在10k左右,分布和其他三个城市差异较大。

[3] 分析各城市工作经验与薪资的关系

        从热力图横向对比来看,随着工作经验的增加,数据分析师的薪资也会相应提高。对有3-5年经验的数据分析师,在北上广深杭五大城市平均基本能拿到20k及以上的薪水;从热力图纵向对比来看,广州在各段上的薪资均不及其他三个一线城市。(由于工作经验小于1年和大于10年的数据量太小,所以没有绘入其中)

3. 从技能角度

[1] 分析不同技能的数据分析岗位的薪资有什么差异

        从不同技能的薪资对比来看,要求会Python/R和要求会SQL所对应的薪资中位数在20k左右,但在薪资上掌握Python/R并没有掌握SQL更有优势;仅要求会Excel的岗位对应的薪资则明显低于前两者。

[2] 分析大公司对不同技能的要求占比有什么差异

        从大公司(2000人以上)对不同技能的要求占比来看,超过70%的岗位要求掌握Python/R;不要求Python/R但要求会SQL的岗位占比不到20%;而仅要求会Excel的岗位占比不到10%

  • 结论和建议

    1.结论

(1)在职业需求量方面,对数据分析师有较大需求的主要还是一线城市,且主要集中于电商、金融和数据服务领域。
(2)在薪资水平方面,北上深杭处于薪资第一梯队,广州作为一线城市在薪资上较其它一线城市无优势;且随着工作经验的增加,数据分析师的薪资会相应提高。
(3)在技能要求方面,九成的大公司要求会Python/R或SQL,但掌握SQL的人比掌握Python/R的薪资更有优势,仅要求会Excel的岗位对应的薪资则明显低于前两者。

    2.建议

(1)从事数据分析职业建议到北上杭等城市的电商、金融和数据服务领域发展,岗位需求量大且薪资水平有优势。
(2)熟练掌握Python/R和SQL有利于跻身大公司并拿到可观薪资,积累工作经验也有助于加薪。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_43335895/article/details/124063273

智能推荐

Jmeter中http请求时加HTTP Cookie管理器,cookie不生效问题

Jmeter中http请求时加HTTP Cookie管理器,cookie不生效问题

python做一个简单网站_python3怎么建立一个简单的网页 | python 搭建网站 教程-程序员宅基地

文章浏览阅读1k次。如何用python和web.py搭建一个网站?环建。环境搭建比较繁记得当时也是满世界找资料以我直接打包好了所有的文件apache(已经放进去python-wscgi) web.py apache所需要的vs2010运行库 python 网站文件),直接解压放上去就能用。有需要同学让我传一个或者网盘发一把就行。装apache并配置python-wscgi,这个比较惨,花了好多时间去搜索才搞定,主..._如何用python3做网站

Windows下的cvs_cvs 不需要windows认证-程序员宅基地

文章浏览阅读1.6k次。版权声明:未作特别说明的内容可以转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明。本文地址:http://www.xujiwei.com/blog/?id=833 在进行团队项目开发的过程当中,源代码版本控制是不可缺少的部分,我目前用过的代码版本控制工具就两个,Visual Source Safe和CVS,呃,准确来说,CVS是昨天才开始用的。 本来,我是一直用着VSS的,比较方便_cvs 不需要windows认证

教你如何使用android studio 4.0发布release 版本 学习记录 仅供参考_android studio怎么编译release版本-程序员宅基地

文章浏览阅读4.4k次。教你如何使用android studio 4.0发布release 版本 学习记录 仅供参考这是老师给我们布置的任务,我在这里做一个简单的总结,话不多说,直接上图上步骤吧注意:我这里参考了[添加链接描述]博主的文章,但是因为版本不一样,所以有些操作画面不一样,但是基本上大同小异,一些专业术语的解释,我就直接把这位大佬的粘贴复制过来了,但是截图是我自己截的(https://blog.csdn.net/to_perfect/article/details/69048419?ops_request_misc=_android studio怎么编译release版本

MPI的all_reduce集合的测试编程_mpi_allreduce-程序员宅基地

文章浏览阅读248次。其中,all_reduce是MPI中的一个重要操作,它用于将每个进程的数据集合到所有进程中,并对集合后的数据进行某种操作(例如求和、求平均值等)。这里使用的操作对象std::plus()表示对整数进行求和操作,你也可以使用其他的操作对象,例如std::multiplies()表示对整数进行乘法操作。Boost是一个广泛使用的C++库,其中包括了对MPI的支持。在上述代码中,我们首先包含了必要的头文件,包括iostream、vector以及boost/mpi.hpp,后者是boost::mpi模块的头文件。_mpi_allreduce

怎么安装vs2013配套的VASSISTX番茄助手_vs2013安装va-程序员宅基地

文章浏览阅读686次。虽然网上的教程都烂大街了,但是我发现身边的人仍然遇到各种问题,所以我整理了自己的安装过程。第一步,下载安装包找到安装包,比如在搜索资源那里搜索“vs2013配套的VASSISTX番茄助手”下载好,双击这个文件第二步,清除干扰文件如果你安装过其他的番茄助手,可以用everything查找visualassist文件,然后删除。第三步,安装安装时,选择2013第四步,破解找到Extensions下的你可以看到名字比较随机的文件夹,例如我的电脑中叫xn1xs1ix.rxy,无论它的名字是什么,_vs2013安装va

随便推点

Windows Server SNMP安裝和配置_windows snmp配置-程序员宅基地

文章浏览阅读1w次,点赞3次,收藏26次。SNMP 简单网络管理协议 (SNMP,Simple Network Management Protocol)SNMP 是专门设计用于在 IP 网络管理网络节点(服务器、工作站、路由器、交换机等)的一种标准协议,它是一种应用层协议。 SNMP 使网络管理员能够管理网络效能,发现并解决网络问题以及规划网络增长。SNMP最为常见的是被工程师用于网络设备流量监控,时时关注流量变化。交换机、路由器等网络设备配置SNMP极为简单,只要定义好SNMP团体字符即可。以Cisco 设备配置范例参考:snmp-ser_windows snmp配置

css-盒子模型详解以及远视图的制作_html如何做远视图-程序员宅基地

文章浏览阅读2.3k次,点赞4次,收藏10次。css盒子模型原理:盒子模型三大部分:css盒子组成部分:border/盒子壁padding/内边距width+height/盒子内容css盒子模型分四部分:margin(外边距)borderpadding: 可以是四个值(代表上,右,下,左);三个值(代表上,下,(左右值相同)) ; 一个值(上下左右都相同))content=width+height(盒子内容)..._html如何做远视图

[ 代码审计篇 ] 代码审计案例详解(二) XXE代码审计案例_等级保护 代码审计记录 示例-程序员宅基地

文章浏览阅读907次,点赞61次,收藏142次。[ 代码审计篇 ] 代码审计案例详解(二) XXE代码审计案例XXE(XML External Entity)是指xml外部实体攻击漏洞。XML外部实体攻击是针对解析XML输入的应用程 序的一种攻击。当包含对外部实体的引用的XML输入被弱配置XML解析器处理时,就会发生这种攻击。 这种攻击通过构造恶意内容,可导致读取任意文件、执行系统命令、探测内网端口、攻击内网网站等危害。_等级保护 代码审计记录 示例

第五章-文本编程_gettextmetrics-程序员宅基地

文章浏览阅读374次。1.CWnd::CreateSolidCaret创建插入符,ShowCaret()显示插入符。GetTextMetrics(),获得当前字体的一些信息。CWnd::CreateCaret()创建图象插入符 bitmap.LoadBitmap(IDB_BITMAP1);//此处的bitmap为成员变量!!! CreateCaret(&bitmap); ShowCaret(); TEX_gettextmetrics

广州大学计算机技术复试c语言试题,2016年广州大学计算机科学与教育软件学院C程序设计考研复试题库...-程序员宅基地

文章浏览阅读780次。一、选择题1. 有以下程序:程序运行后的输出结果是( )。 A.8, 17 B.8, 16 C.8, 8 D.8, 20 答:A【解析】static 变量编译时,将其分配在内存的静态存储区中,在整个程序运行期间都不释放这些存储单元, 即使退出函数,下次再进入该函数时,静态局部变量仍使用原来的存储单元,值 程序执行过程为:是上一次函数调用结束时的值。调用函数,再次调用函数,2. 有..._广州大学c语言程序设计考研初试复试历年真题及答案汇总+高分笔记资料题库+专业课

计算机专业知识内容,计算机专业知识:计算机的设计原理及工作原理-程序员宅基地

文章浏览阅读628次。【导读】2016年小编为各位考生提供事业单位计算机考试题库、事业单位计算机考试专业知识。中公事业单位招聘考试网帮助各位考生获取更多精彩内容,助力考生顺利备考。1.简述计算机的设计原理。答:计算机的设计原理是根据美籍匈牙利科学家冯•诺依曼提出了“程序存储、程序控制”的设计思想,同时指出计算机的构成包括以下三个方面:(1)由运算器、存储器、控制器、输入、输出设备五大基本部件组成计算机系统,并规定了五大..._通常所说的计算机科学关注于控制原理和系统实现,大部分研究是基于“冯·诺依

推荐文章

热门文章

相关标签