按照科研层次,将数据集(资源)类型划分为如下四方面

- 社会
- 企业
- 用户
- 其他

本列表所展示的数据集,均为整理自网络公开内容。 为方便经管社科领域学者开展大数据范式的科学研究,本列表将展示如何用 Python 处理这类大体量数据集。

如有任何问题, 可加微信 372335839,备注「姓名-学校-专业」。



社会




企业


- [词向量 | 使用 MD&A2001-2024 语料训练 Word2Vec 模型](https://textdata.cn/blog/2023-03-24-load-w2v-and-expand-your-concpet-dicitonary/) - [数据集 | Layline 美股内幕交易数据集](https://textdata.cn/blog/2025-03-11-layline-insider-trading-dataset/) - [数据集 | 聚焦美股企业社会责任 CSR Wire 网站新闻数据集(1999-2024)](https://textdata.cn/blog/2024-07-19-csrwise-dataset/) - [数据集 | 36330 条上市公司仲裁数据(2000-2021.9)](https://textdata.cn/blog/2024-01-03-listed-company-arbitration-dataset/) - [数据集 | 07-21 年上市公司「委托贷款公告」](https://textdata.cn/blog/2023-04-26-entrusted-loan-dataset/) - [数据集 | 90w 条中国上市公司高管数据](https://textdata.cn/blog/2022-11-25-senior-manager-resume-dataset/) - [数据集| 1850 万条世界地图 POI 兴趣点数据集](https://textdata.cn/blog/2022-12-10-1850w-poi-dataset/)



用户




其他