2022暑期工作坊 | Python实证指标构建与文本分析

在前大数据时代,一般使用实验法、调查问卷、访谈或者二手数据等方式,将数据整理为结构化的表格数据,之后再使用各种计量分析方法,对这些表格数据进行分析。但大数据时代,网络数据成为各方学者亟待挖掘的潜在宝藏,大量商业信息、社会信息以文本等非结构化、异构型数据格式存储于海量的网页中。那么对于经管为代表的人文社科类专业科研工作者而言,通过Python可以帮助学者解决使用Web数据进行科研面临的两个问题:网络爬虫技术 解决如何从网络世界中高效地采集数据?文本分析技术 解决如何从杂乱的文本数据中抽取实证指标(情绪、不确定、态度、认知等变量)...

2022-07-10 · 3 min · 大邓

Asent库 | 英文文本数据情感分析

使用Python做英文情感分析,考虑否定词、程度副词对情感词的修饰作用。...

2022-07-10 · 2 min · 大邓

视频分享| Python数据挖掘与金融科技

应云南大学管理学院邀请,参加第一届中国研究生金融科技创新大赛讲座。做Python文本数据挖掘在金融科技中的应用。...

2022-06-24 · 2 min · 大邓

欢迎各位向cntext库分享情感词典

随着cntext内置词典丰富了,使用cntext做文本分析会更好用、更易用。...

2022-06-12 · 5 min · 大邓

实战 | 构建基于客户细分的 K-Means 聚类算法!

客群细分对于企业了解目标受众非常重要。根据受众群体的不同,我们可以给采取不同的营销策略。目前有许多无监督的机器学习算法可以帮助公司识别他们的用户群并创建消费群体。...

2022-06-09 · 4 min · 大邓