2001-2022年A股年报数据集,含2个文件,共2G。
-
年报 A01-22.xlsx
-
管理层讨论与分析 mda01-22.xlsx
xlsx与csv相比,同样的数据量,文件体积会小很多。截图对比
注意, 当数据的记录数小于100w条, 数据如果不考虑体积,存储到csv和xlsx都是okay的,推荐xlsx。当数据记录数大于100w, 只能存储到csv。
数据获取
内容为付费数据集, 50元, 加微信 372335839, 备注「姓名-学校-专业」
一、年报数据
2001-2022年, 年报数据
import pandas as pd
df = pd.read_excel('A01-22.xlsx')
df.head()
Run
len(df)
Run
55222
二、MD&A数据
2001-2022年MD&A数据
import pandas as pd
mda_df = pd.read_excel('mda01-22.xlsx')
mda_df.head()
Run
len(mda_df)
Run
55439