一、数据介绍

1.1 数据集概况

- 数据集名: 上市公司仲裁数据
- 时间跨度: 2000-01-26 ~ 2021-09-28
- 案件数据: 36330
- 数据来源: 裁判文书网

  

数据整理自数据集 | 中国裁判文书网(2010-2021)


1.2 声明

科研用途;需要的请加微信 372335839, 备注「姓名-学校-专业」。


1.3 相关文献

上市公司仲裁数据可用于衡量上市公司法律风险等,

[1]冯延超,梁莱歆.上市公司法律风险、审计收费及非标准审计意见——来自中国上市公司的经验证据[J].审计研究,2010(03):75-81.
[2]祝继高.会计稳健性与债权人利益保护——基于银行与上市公司关于贷款的法律诉讼的研究[J].会计研究,2011(05):50-57+96.
[3]辛宇,黄欣怡,纪蓓蓓.投资者保护公益组织与股东诉讼在中国的实践——基于中证投服证券支持诉讼的多案例研究[J].管理世界,2020,36(01):69-87+235.


1.4 字段

 -  公告日期
 -  股票代码
 -  股票简称
 -  涉案类型
 -  原告被告
 -  案件案由
 -  涉案金额
 -  判决情况
 -  执行情况
 -  货币种类



二、查看数据

2.1 读取数据

import pandas as pd

df = pd.read_excel('上市公司仲裁数据2000-2021.xlsx')

df['公告日期'] = pd.to_datetime(df['公告日期'])
df.head()


2.2 记录数

len(df)

Run

36330

2.3 公司数

涉案的上市公司数量

df['股票代码'].nunique()

Run

2251

2. 4 覆盖日期

print(df['公告日期'].min())
print(df['公告日期'].max())

Run

2000-01-26 00:00:00
2021-09-28 00:00:00

2.5 字段&缺失率

for col in df.columns:
    ratio = df[col].isna().sum()/len(df)
    print(col, ratio)

Run

公告日期 0.0
股票代码 0.0
股票简称 2.7525461051472613e-05
涉案类型 0.0002202036884117809
原告被告 0.001568951279933939
案件案由 0.00013762730525736306
涉案金额 0.00016515276630883568
判决情况 0.8911643270024773
执行情况 0.740765207817231
货币种类 0.0


广而告之