一、上市公司招聘数据集
1.1 概况
数据集名: 上市公司招聘数据集(2014~2023)
数据来源: 招聘网站(如智联招聘、Boss直聘等)
记录数两: 6933415
覆盖日期: 2014-01-07 ~ 2023-12-31
数据格式: csv
数据体积: 7.37 G
1.2 字段介绍
- company 企业名称
- listed_rel 与上市公司关系
- stkcd 关联股票代码
- job 招聘岗位
- city 工作城市
- area 工作区域
- min_sal 最低月薪
- max_sal 最高月薪
- desc 职位描述
- edu 学历要求
- exp 经验要求
- hires 招聘人数
- category 招聘类别
- class 招聘分级
- loc 公司地点
- work_loc 工作地点
- post_date 发布招聘日期
- close_date 结束招聘日期
- source 招聘发布的平台
1.3 说明
科研用途;如有问题, 请加微信372335839,备注「姓名-学校-专业」
二、查看数据
2.1 读取数据
import pandas as pd
df = pd.read_csv('上市公司招聘大数据2014-2023年.csv.gz', compression='gzip')
#或 解压得到csv再读取
#df = pd.read_csv('上市公司招聘大数据2014-2023年.csv')
print('记录条数:', len(df))
df
Run
记录条数: 6933415
2.2 覆盖日期
df['post_date'] = pd.to_datetime(df['post_date'])
print('覆盖日期: ', df['post_date'].min().date(), '~', df['post_date'].max().date())
Run
覆盖日期: 2014-01-07 ~ 2023-12-31
2.3 字段缺失程度
使用 missingno库 可视化数据集的字段缺失程度,
import missingno as ms
ms.matrix(df)
可以看到 classs、 loc、 work_loc 这几个字段缺失较多, 而其余字段缺失程度很轻。
相关文献
[1]Gao, Janet, Kenneth J. Merkley, Joseph Pacelli, and Joseph H. Schroeder. "Do internal control weaknesses affect firms’ demand for accounting skills? Evidence from US job postings." The Accounting Review 98, no. 3 (2023): 203-228.
[2]Campello, Murillo, Gaurav Kankanhalli, and Pradeep Muthukrishnan. "Corporate hiring under Covid-19: Financial constraints and the nature of new jobs." Journal of Financial and Quantitative Analysis 59, no. 4 (2024): 1541-1585.
[3]Cao, Yi, Shijun Cheng, Jennifer Wu Tucker, and Chi Wan. "Technological peer pressure and skill specificity of job postings." Contemporary Accounting Research 40, no. 3 (2023): 2106-2139.
[4]马双, 肖翰, 李丁, 张鹏. 最低工资与异质性人力资本需求:基于招聘网站数据的研究[J]. 世界经济, 2023, 46 (12): 92-114.
[5]莫怡青, 李力行. 零工经济对创业的影响——以外卖平台的兴起为例[J]. 管理世界, 2022, 38 (02): 31-45+3.
[6]罗楚亮, 刘盼. 公共就业服务机构匹配效率及其地区差异[J]. 管理世界, 2022, 38 (07): 133-147.
[7]刘毓芸, 程宇玮. 重点产业政策与人才需求——来自企业招聘面试的微观证据[J]. 管理世界, 2020, 36 (06): 65-79+245.
精选内容
- LIST | 可供社科(经管)领域使用的数据集汇总
- LIST | 社科(经管)数据挖掘文献资料汇总
- 推荐 | 文本分析库cntext2.x使用手册
- 付费视频课 | Python实证指标构建与文本分析
- 教程 | 使用大模型将文本数据转化为结构化数据
- 爬虫代码 | 使用Python采集黑猫投诉网数据
- 数据集| 1500w+消费者投诉数据集(2018 ~ 2024.8)
- 数据集 | 应届生招聘数据集(2014~2024.12)