LIST | 可供社科(经管)领域使用的科研数据集清单

可供社科(经管)使用的数据集...

2025-04-03 · 2 min · 大邓

LIST | 社科(经管)数据挖掘文献资料汇总

如何从网络世界中高效地采集数据?是否能从文本中挖掘出人类的偏见等认知信息?如何从杂乱的文本数据中抽取文本信息(变量)?本文汇总的列表将让你对文本、对Python文本分析个全面的了解...

2024-04-15 · 2 min · 大邓

教程 | 使用大模型将文本数据转化为结构化数据

实验数据为外卖评论, 今天咱们做个有难度的文本分析任务,从不同维度(味道、速度、服务)对外卖评论进行打分(-1.0~1.0)文本分析(也称为文本挖掘或自然语言处理,NLP)是指使用计算机算法和技术从大量文本数据中提取有价值信息的过程。文本分析的目标是从非结构化的文本数据中识别模式、提取关键信息、理解语义,并将其转化为结构化数据以便进一步分析和应用。...

2025-02-14 · 4 min · 大邓

可视化 | 人民日报语料反映七十年文化演变

使用人民日报1946-2023年之间的新闻数据,通过语义距离刻画文化的变迁。...

2025-04-03 · 5 min · 大邓

词向量 | 使用人民网领导留言板语料训练 Word2Vec 模型

...

2025-04-03 · 4 min · 大邓