一、上市公司招聘数据集

1.1 概况

数据集名:  上市公司招聘数据集(2014~2023)
数据来源:  招聘网站(如智联招聘、Boss直聘等)
记录数两:  6933415
覆盖日期:  2014-01-07 ~ 2023-12-31
数据格式:  csv
数据体积:  7.37 G

1.2 字段介绍

- company    企业名称
- listed_rel 与上市公司关系
- stkcd      关联股票代码
- job        招聘岗位
- city       工作城市
- area       工作区域
- min_sal    最低月薪
- max_sal    最高月薪
- desc       职位描述
- edu        学历要求
- exp        经验要求
- hires      招聘人数
- category   招聘类别
- class      招聘分级
- loc        公司地点
- work_loc   工作地点
- post_date  发布招聘日期
- close_date 结束招聘日期
- source     招聘发布的平台

1.3 说明

科研用途;如有问题, 请加微信372335839,备注「姓名-学校-专业」



二、查看数据

2.1 读取数据

import pandas as pd

df = pd.read_csv('上市公司招聘大数据2014-2023年.csv.gz', compression='gzip')
#或  解压得到csv再读取
#df = pd.read_csv('上市公司招聘大数据2014-2023年.csv')

print('记录条数:', len(df))
df

Run

记录条数: 6933415


2.2 覆盖日期

df['post_date'] = pd.to_datetime(df['post_date'])

print('覆盖日期: ', df['post_date'].min().date(), '~', df['post_date'].max().date())

Run

覆盖日期:  2014-01-07 ~ 2023-12-31



2.3 字段缺失程度

使用 missingno库 可视化数据集的字段缺失程度,

import missingno as ms

ms.matrix(df)

可以看到 classslocwork_loc 这几个字段缺失较多, 而其余字段缺失程度很轻。



相关文献

[1]Gao, Janet, Kenneth J. Merkley, Joseph Pacelli, and Joseph H. Schroeder. "Do internal control weaknesses affect firms’ demand for accounting skills? Evidence from US job postings." The Accounting Review 98, no. 3 (2023): 203-228.
[2]Campello, Murillo, Gaurav Kankanhalli, and Pradeep Muthukrishnan. "Corporate hiring under Covid-19: Financial constraints and the nature of new jobs." Journal of Financial and Quantitative Analysis 59, no. 4 (2024): 1541-1585.
[3]Cao, Yi, Shijun Cheng, Jennifer Wu Tucker, and Chi Wan. "Technological peer pressure and skill specificity of job postings." Contemporary Accounting Research 40, no. 3 (2023): 2106-2139.
[4]马双, 肖翰, 李丁, 张鹏. 最低工资与异质性人力资本需求:基于招聘网站数据的研究[J]. 世界经济, 2023, 46 (12): 92-114.
[5]莫怡青, 李力行. 零工经济对创业的影响——以外卖平台的兴起为例[J]. 管理世界, 2022, 38 (02): 31-45+3.
[6]罗楚亮, 刘盼. 公共就业服务机构匹配效率及其地区差异[J]. 管理世界, 2022, 38 (07): 133-147.
[7]刘毓芸, 程宇玮. 重点产业政策与人才需求——来自企业招聘面试的微观证据[J]. 管理世界, 2020, 36 (06): 65-79+245.


精选内容