文化分析&Python

https://melaniewalsh.github.io/Intro-Cultural-Analytics/welcome.html

本书对应于康奈尔大学和华盛顿大学教授的本科课程《文化分析简介:数据、计算和文化》,主要介绍了如何使用 Python 来研究文化材料,例如歌词、短篇小说、报纸文章、推文、Reddit 帖子和电影剧本。 它还介绍了网络抓取、API、主题建模、命名实体识别 (NER)、网络分析和映射等计算方法。

这些材料最初是为了支持“”,这是。

  • 什么是文化分析?

文化分析是用计算方法研究文化。 文化是一个广义的术语,包括文学、历史、政治、艺术、音乐、社交媒体等等。 文化分析是数字人文和信息科学等领域不断发展的研究领域。


计算和推理思维:数据科学基础

Computational and Inferential Thinking: The Foundations of Data Science

https://inferentialthinking.com/chapters/intro.html

加州大学伯克利分校数据科学基础课程结合了三个观点:推理思维、计算思维和现实世界的相关性。 给定来自某些现实世界现象的数据,如何分析该数据以了解该现象? 该课程教授计算机编程和统计推断方面的关键概念和技能,并结合对现实世界数据集的动手分析,包括经济数据、文档集、地理数据和社交网络。 它深入探讨了围绕数据分析的社会问题,例如隐私和设计。该课程是与伯克利数据科学部合作提供的。


使用 PySAL 和 PyData 堆栈的地理数据科学¶

https://geographicdata.science/book/intro.html

地理数据无处不在。总体而言,社会过程、物理环境和个人行为在其地理模式、结构和间隔方面表现出惊人的规律性。随着与这些系统相关的数据在范围、强度和深度上的增长,从位置等常见地理属性中提取有意义的见解变得更加重要,而且如何利用标准数据科学中不太常见的拓扑属性(例如关系)也变得更加重要。

本书介绍了一种思考地理挑战的新方法, 如空间自相关(Spatial Autocorrelation)、点模式分析(Point Pattern Analysis)。使用地理分析和计算推理,它向读者展示了如何解开隐藏在数据中的新见解。本书围绕 Python 中可用的优秀数据科学环境构建,提供示例和工作分析供读者复制、适应、扩展和改进。


心理科学Python编程

https://lukas-snoek.com/introPy/index.html

阿姆斯特丹大学为心理学硕士研究生开设的,是为期 4 周的“心理科学编程”课程的一部分,从两周的 R 编程开始,之后学生可以在剩下的两周内选择两个主题之一:高级 R 或 Python/PsychoPy(本课程) 。因此,本 Python/PsychoPy 课程假设学生熟悉基本的编程概念(例如条件、循环和函数)。 在本课程的第 1 周,我们将深入研究 Python 特定的主题(至少与 R 相比),例如面向对象编程和最重要的数据处理包(包括 pandas、numpy 和 matplotlib)。 在第 2 周,我们将讨论如何使用 PsychoPy 软件包通过其图形界面 (Builder) 和 Python 界面 (Coder) 创建实验。


OpenPifPaf:用于语义关键点检测和时空关联的复合字段

  • OpenPifPaf: Composite Fields for Semantic Keypoint Detection and Spatio-Temporal Association

经济和金融领域的 Python 编程

https://quantecon.org/python-lectures/

https://python.quantecon.org/intro.html


信用卡欺诈机器学习识别

https://fraud-detection-handbook.github.io/fraud-detection-handbook/Foreword.html

ML 技术在支付卡欺诈检测系统中的集成大大提高了它们更有效地检测欺诈的能力,并协助支付处理中介识别非法交易。尽管近年来欺诈交易的数量不断增加,但欺诈造成的损失百分比在 2016 年开始下降,这是与 ML 解决方案越来越多地采用相关的反向趋势。 [rep19]。除了帮助节省资金外,实施基于机器学习的欺诈检测系统如今已成为机构和公司赢得客户信任的必要条件。

在这个用于卡欺诈检测的机器学习新领域中,一个被广泛认可和反复出现的问题是关于该主题 [LJ20,PP19,PL18,ZAM+16] 发表的大多数研究工作缺乏可重复性。一方面,支付卡交易数据缺乏可用性,出于保密原因不能公开共享。另一方面,作者没有做出足够的努力来提供他们的代码并使他们的结果可重现。

本书所介绍的一些技术,例如处理类别不平衡、模型集成或概念漂移的技术,被广泛认为是信用卡欺诈检测系统设计的重要组成部分。我们还涵盖了我们认为值得更多关注的记录较少的主题。其中包括建模过程的特定设计方面,例如性能指标和验证策略的选择,以及有前景的预处理和学习策略,例如特征嵌入、主动学习和迁移学习。虽然本书侧重于支付卡欺诈,但我们相信本书中介绍的大多数技术和讨论对从事更广泛的欺诈检测主题的其他从业者有用。


音乐分类:超越监督学习,走向现实世界的应用

https://music-classification.github.io/tutorial/landing-page.html

音乐分类是一项音乐信息检索 (MIR) 任务,其目标是对音乐语义的计算理解。 对于给定的歌曲,分类器预测相关的音乐属性。 根据任务定义,分类任务几乎是无限的——从流派、情绪和乐器到更广泛的概念,包括音乐相似性和音乐偏好。 检索到的信息可以进一步用于许多应用,包括音乐推荐、策展、播放列表生成和语义搜索。



广而告之