文本相似 | Lazy Prices公司年报内容变动预示重大风险 一个公司报告文件会有不同部分,我们需要将不同的部分分别识别出来。这里用到正则表达式,可以进行快速的数据清洗和数据抽取。文本转为向量后就可以进行相似度计算,...