即将开班 | 2022Python数据挖掘寒假工作坊

大数据时代,网络数据成为各方学者亟待挖掘的潜在宝藏,大量商业信息、社会信息以文本等非结构化、异构型数据格式存储于海量的网页中。那么对于经管为代表的人文社科类专业科研工作者而言,通过Python可以帮助学者解决使用Web数据进行科研面临的两个问题: 网络爬虫技术解决 如何从网络世界中高效地采集数据?文本分析技术解决如何从杂乱的文本数据中抽取文本信息(变量)?...

2022-01-15 · 3 min · 大邓

Stargazer库 | 创建漂亮可发表的多元回归表

可用于创建漂亮的、可发表的多元回归表...

2022-01-02 · 1 min · 大邓

PNAS | 情侣分手3个月前就有预兆!聊天记录还能反映分手后遗症

女友提出分手,你是不是后悔没有早点察觉?这不,关于分手前的聊天记录的文本分析,科学家给出了答案。...

2022-01-02 · 1 min · 桃子 小咸鱼

量化历史语言学-贝叶斯语言谱系分析

量化历史语言学,尤其是贝叶斯语言谱系分析的前世今生,以及可能的未来...

2022-01-01 · 4 min · 小云哥哥

Python与文化分析入门

如何使用 Python 来研究文化领域的数据,例如歌词、短篇小说、报纸文章、推文、Reddit 帖子和电影剧本。 它还介绍了网络抓取、API、主题建模、命名实体识别 (NER)、网络分析和映射等计算方法。这些材料最初是为了支持“**文化分析简介:数据、计算和文化**”,这是康奈尔大学和华盛顿大学教授的本科课程。...

2021-12-31 · 1 min · 大邓