一、上市公司招聘数据集

1.1 概况

数据集名:  上市公司招聘数据集(2014~2023)
数据来源:  招聘网站(如智联招聘、Boss直聘等)
记录数两:  6933415
覆盖日期:  2014-01-07 ~ 2023-12-31
数据格式:  csv
数据体积:  7.37 G

1.2 字段介绍

- company    企业名称
- listed_rel 与上市公司关系
- stkcd      关联股票代码
- job        招聘岗位
- city       工作城市
- area       工作区域
- min_sal    最低月薪
- max_sal    最高月薪
- desc       职位描述
- edu        学历要求
- exp        经验要求
- hires      招聘人数
- category   招聘类别
- class      招聘分级
- loc        公司地点
- work_loc   工作地点
- post_date  发布招聘日期
- close_date 结束招聘日期
- source     招聘发布的平台

1.3 说明

科研用途;如有问题, 请加微信372335839,备注「姓名-学校-专业」



二、查看数据

2.1 读取数据

import pandas as pd

df = pd.read_csv('上市公司招聘大数据2014-2023年.csv.gz', compression='gzip')
#或  解压得到csv再读取
#df = pd.read_csv('上市公司招聘大数据2014-2023年.csv')

print('记录条数:', len(df))
df

Run

记录条数: 6933415


2.2 覆盖日期

df['post_date'] = pd.to_datetime(df['post_date'])

print('覆盖日期: ', df['post_date'].min().date(), '~', df['post_date'].max().date())

Run

覆盖日期:  2014-01-07 ~ 2023-12-31



2.3 字段缺失程度

使用 missingno库 可视化数据集的字段缺失程度,

import missingno as ms

ms.matrix(df)

可以看到 classslocwork_loc 这几个字段缺失较多, 而其余字段缺失程度很轻。



2.4 数据源

print(df.source.nunique())
print(df.source.unique())

Run

98
array(['猎聘网', '百姓网', 'boss直聘', '找工易', '拉勾网', '首都人才网', '智联招聘', '58同城',
       '0577HR', '猎聘', '赶集网', '看准网', 'BOSS直聘', '北极星招聘', 'OFweek人才网',
       '职友集', '前程无忧', '照明专业人才网', '智通人才网', '一览英才网', '全才招聘网', '博才网', '无忧招聘',
       '斗米兼职', '云南招聘网', '建筑英才网', '597人才网', '齐鲁人才网', '大街网', '百城招聘网',
       '仟寻移动招聘', '脉脉', '领航印刷人才网', '中国人才热线', '香草招聘', '厦门人才网', '中华英才网',
       '招才网', '中国金融人才网', '中国船舶人才网', '中国石油人才网', '智联卓聘', '珠江人才网', '中国食品人才网',
       '中国汽车人才网', '九州英才网', '大众人才网', '荆楚人才网', '湖南人事人才网', '普工招聘网', '力聘网',
       '纺织行业人才网', '汇博人才网', '斗米', '51招聘英才网', '康强医疗人才网', '中国药业人才网', '应届生',
       '华北人才网', '大上海人才', '钱江人才网', '必高环保人才网', '线缆招聘网', '数字英才网',
       'CFW中国服装人才网', '华西人才网', '潇湘人才网', '医疗专业人才网', '中国服装人才网', '国际人才网',
       '通信人才网', '台州人力网', '燕赵人才网', '约才网', '俊才招聘网', '建筑专业人才网', '台州招聘网',
       '钢结构招聘网', '闽江人才网', '智聪人才网', '广西人才网', '桂冠人才网', '南宁招聘网', '今日招聘',
       '汽车人招聘网', '求职直通车网', '食品人才网', '最佳东方', '扬子人才网', '汽车人招聘', '联英人才网',
       '销售人才网', '天南地北人才网', '中州人才网', '江淮人才网', '中国美容招聘网', '关中人才网', '兼职猫'],
      dtype=object)



相关文献

[1]Gao, Janet, Kenneth J. Merkley, Joseph Pacelli, and Joseph H. Schroeder. "Do internal control weaknesses affect firms’ demand for accounting skills? Evidence from US job postings." The Accounting Review 98, no. 3 (2023): 203-228.
[2]Campello, Murillo, Gaurav Kankanhalli, and Pradeep Muthukrishnan. "Corporate hiring under Covid-19: Financial constraints and the nature of new jobs." Journal of Financial and Quantitative Analysis 59, no. 4 (2024): 1541-1585.
[3]Cao, Yi, Shijun Cheng, Jennifer Wu Tucker, and Chi Wan. "Technological peer pressure and skill specificity of job postings." Contemporary Accounting Research 40, no. 3 (2023): 2106-2139.
[4]马双, 肖翰, 李丁, 张鹏. 最低工资与异质性人力资本需求:基于招聘网站数据的研究[J]. 世界经济, 2023, 46 (12): 92-114.
[5]莫怡青, 李力行. 零工经济对创业的影响——以外卖平台的兴起为例[J]. 管理世界, 2022, 38 (02): 31-45+3.
[6]罗楚亮, 刘盼. 公共就业服务机构匹配效率及其地区差异[J]. 管理世界, 2022, 38 (07): 133-147.
[7]刘毓芸, 程宇玮. 重点产业政策与人才需求——来自企业招聘面试的微观证据[J]. 管理世界, 2020, 36 (06): 65-79+245.


精选内容