一、数据介绍
1.1 数据集概况
- 数据集名: 上市公司仲裁数据
- 时间跨度: 2000-01-26 ~ 2021-09-28
- 案件数据: 36330
- 数据来源: 裁判文书网
1.2 声明
科研用途;需要的请加微信 372335839, 备注「姓名-学校-专业」。
1.3 相关文献
上市公司仲裁数据可用于衡量上市公司法律风险等,
[1]冯延超,梁莱歆.上市公司法律风险、审计收费及非标准审计意见——来自中国上市公司的经验证据[J].审计研究,2010(03):75-81.
[2]祝继高.会计稳健性与债权人利益保护——基于银行与上市公司关于贷款的法律诉讼的研究[J].会计研究,2011(05):50-57+96.
[3]辛宇,黄欣怡,纪蓓蓓.投资者保护公益组织与股东诉讼在中国的实践——基于中证投服证券支持诉讼的多案例研究[J].管理世界,2020,36(01):69-87+235.
1.4 字段
- 公告日期
- 股票代码
- 股票简称
- 涉案类型
- 原告被告
- 案件案由
- 涉案金额
- 判决情况
- 执行情况
- 货币种类
二、查看数据
2.1 读取数据
import pandas as pd
df = pd.read_excel('上市公司仲裁数据2000-2021.xlsx')
df['公告日期'] = pd.to_datetime(df['公告日期'])
df.head()
2.2 记录数
len(df)
Run
36330
2.3 公司数
涉案的上市公司数量
df['股票代码'].nunique()
Run
2251
2. 4 覆盖日期
print(df['公告日期'].min())
print(df['公告日期'].max())
Run
2000-01-26 00:00:00
2021-09-28 00:00:00
2.5 字段&缺失率
for col in df.columns:
ratio = df[col].isna().sum()/len(df)
print(col, ratio)
Run
公告日期 0.0
股票代码 0.0
股票简称 2.7525461051472613e-05
涉案类型 0.0002202036884117809
原告被告 0.001568951279933939
案件案由 0.00013762730525736306
涉案金额 0.00016515276630883568
判决情况 0.8911643270024773
执行情况 0.740765207817231
货币种类 0.0