2001-2022年A股年报数据集,含2个文件,共2G。

  • 年报 A01-22.xlsx

  • 管理层讨论与分析 mda01-22.xlsx

xlsx与csv相比,同样的数据量,文件体积会小很多。截图对比

注意, 当数据的记录数小于100w条, 数据如果不考虑体积,存储到csv和xlsx都是okay的,推荐xlsx。当数据记录数大于100w, 只能存储到csv。



数据获取

内容为付费数据集, 50元, 加微信 372335839, 备注「姓名-学校-专业」



一、年报数据

2001-2022年, 年报数据

import pandas as pd

df = pd.read_excel('A01-22.xlsx')
df.head()

Run


len(df)

Run

55222



二、MD&A数据

2001-2022年MD&A数据

import pandas as pd

mda_df = pd.read_excel('mda01-22.xlsx')
mda_df.head()

Run


len(mda_df)

Run

55439



广而告之