词向量 | 使用人民网领导留言板语料训练 Word2Vec 模型

...

2025-04-03 · 5 min · 大邓

词向量 | 使用 MD&A2001-2023 语料训练 Word2Vec/GloVe 模型

...

2025-04-03 · 5 min · 大邓

新闻数据集(中文) | 含 人民日报/光明日报/参考消息/经济日报 等 120 家媒体(2025.03)

日报数据集研究价值大, 您可从中提取丰富的指标,包括但不限于经济政策不确定性指数EPU 、 媒体关注度指数、文本相似度、情感分析。而且可训练词向量,构建新的词典,开发新的指标指数。计算机自然语言处理、经济学、管理学、新闻传播学、公共管理等领域均可使用。...

2025-03-22 · 9 min · 大邓

数据集 | 5112万条专利申请数据集(1985-2025)

5112万条专利申请数据集(1985-2025)...

2025-03-07 · 4 min · 大邓

数据集 | 上市公司招聘数据(2014~2023)

...

2025-03-06 · 2 min · 大邓