12G数据集 | 23w条Kickstarter项目信息

2016年3月写好的kickstarter爬虫,每月执行一次。截止2022年11月, 所有压缩文件累积11.42G。文末有数据获取方式...

2022-12-04 · 4 min · 大邓

BERTopic | 使用推特数据构建动态主题模型

在本文中将使用BERTopic库,对美国前总统Trump推特数据集,构建动态主题模型DTM(Dynamic Topic Modeling),可视化文档数据集中不同主题随时间的演变(变迁)。...

2022-12-04 · 4 min · 大邓

JM2022 | 梳理营销领域使用网络爬虫技术的研究

Journal of Marketing 2022年一篇关于营销领域使用网络爬虫收集数据的文献...

2022-12-03 · 4 min · Boegershausen

社会学研究 | 社会计算驱动的社会科学研究方法

一篇关于计算社会学方法论的综述性论文

2022-12-03 · 1 min · 周涛

数据集 | 90w条中国上市公司高管数据

...

2022-11-25 · 2 min · 大邓