LIST | 可供社科(经管)领域使用的科研数据集清单

可供社科(经管)使用的数据集...

2025-03-13 · 2 min · 大邓

LIST | 社科(经管)数据挖掘文献资料汇总

如何从网络世界中高效地采集数据?是否能从文本中挖掘出人类的偏见等认知信息?如何从杂乱的文本数据中抽取文本信息(变量)?本文汇总的列表将让你对文本、对Python文本分析个全面的了解...

2024-04-15 · 2 min · 大邓

教程 | 使用大模型将文本数据转化为结构化数据

实验数据为外卖评论, 今天咱们做个有难度的文本分析任务,从不同维度(味道、速度、服务)对外卖评论进行打分(-1.0~1.0)文本分析(也称为文本挖掘或自然语言处理,NLP)是指使用计算机算法和技术从大量文本数据中提取有价值信息的过程。文本分析的目标是从非结构化的文本数据中识别模式、提取关键信息、理解语义,并将其转化为结构化数据以便进一步分析和应用。...

2025-02-14 · 4 min · 大邓

数据集 | 5513w条外文电影评论数据(1900~2021.9)

数据集采集自Rotten Tomatoes网站, 含 10500部电影,5600万+ 用户评价!其中有 100 万+为精选评论! 电影从20世纪初到2024年的都有!英语、法语、日语、 Hindi 以及许多其他语言的电影! 该数据集的用途包括计算机科学自然语言处理,社会学文化演变、刻板印象,传播学等。...

2025-03-17 · 1 min · 大邓

推荐 | 文本分析库cntext2.x使用手册

...

2025-03-14 · 14 min · 大邓