使用textstat库计算文本可读性

使用textstat库计算文本可读性...

2022-10-22 · 2 min · 大邓

1.5G数据集 | 200万条Indiegogo众筹项目信息

1.57G indiegogo-dataset.jpeg...

2022-10-16 · 1 min · 大邓

Python | 词移距离(Word Mover's Distance)

词移距离可以为我们提供短文相似度计算,距离越小,两文档相似度越高。...

2022-10-16 · 1 min · 大邓

数据集 | 2007-2021年A股上市公司年度报告(txt文件)

2007-2021年A股上市公司年度报告(txt文件)

2022-10-16 · 1 min · 大邓

数据集 | 多语言对齐词向量预训练模型

借助该预训练模型,应该能做可做跨文化对比分析...

2022-10-16 · 2 min · 大邓