使用 5000w 专利申请数据集按年份(按省份)训练词向量

...

2025-04-04 · 7 min · 大邓

可视化 | 人民日报语料反映七十年文化演变

使用人民日报1946-2023年之间的新闻数据,通过语义距离刻画文化的变迁。...

2025-04-03 · 6 min · 大邓

词向量 | 使用人民网领导留言板语料训练 Word2Vec 模型

...

2025-04-03 · 5 min · 大邓

实验 | 使用Stanford Glove代码训练中文语料的Glove模型

...

2025-03-28 · 3 min · 大邓

新闻数据集(中文) | 含 人民日报/光明日报/参考消息/经济日报 等 120 家媒体(2025.03)

日报数据集研究价值大, 您可从中提取丰富的指标,包括但不限于经济政策不确定性指数EPU 、 媒体关注度指数、文本相似度、情感分析。而且可训练词向量,构建新的词典,开发新的指标指数。计算机自然语言处理、经济学、管理学、新闻传播学、公共管理等领域均可使用。...

2025-03-22 · 9 min · 大邓