Dataspell——一个专为数据科学家制作的IDE。 一方面,您拥有 Jupyter 以实现最大的交互性,另一方面拥有 PyCharm 作为专业环境。
什么是DataSpell?
Dataspell 是专为数据科学家制作的 IDE(集成开发环境)。 它由 Jetbrains ( IntelliJ Idea 和 PyCharm 背后的一家公司)开发,支持所有主要操作系统平台,包括 ARM (M1) Mac。
DataSpell亮点:
- 原生notebook体验——如果你使用过 Jupyter 会有宾至如归的感觉。
- 智能代码辅助 - 有点像 Jupyter 和 PyCharm 生了孩子。
- Markdown 和 JavaScript — 根据需要设置notebook样式并嵌入数据可视化。
- 交互式外壳 - REPL 控制台 + 语法检查。
- SQL 数据库支持 — 连接到数据库、直观地检查数据、导入/导出数据等。
打开dataspell,很像PyCharm
创建你的第一个notebook
该过程几乎与任何其他 Jetbrains 产品相同。 点击根目录,进入新建——Jupyter Notebook:
我将其命名为 first_notebook.ipynb。
样式是个人喜好的东西,但你不能说设计不是一流的。
在创建笔记本时,您可能已经看到创建 R 脚本和 Markdown 文件的选项。 一旦 Python 正常运行,Dataspell 将同时支持 R 和 Julia(来源)。
现在让我们探索基本的 Python 和数据科学库是如何工作的。 下图显示了 Numpy 数组和 Pandas DataFrame:
正如预期的那样。 我喜欢 Numpy 数组打印为 Pandas 系列的方式,但这只是个人喜好。 Matplotlib 呢? 这是一个真正简单的散点图:
我更喜欢出版物可视化的白色背景,但在晚上工作时眼睛无法长时间工作,夜晚我喜欢黑色背景。 干得好,Dataspell。
接下来,让我们探索每个 IDE 必须具备的功能——智能编码辅助。
智能编码辅助
我不喜欢 JupyterLab 的是缺乏编码帮助。 确实有插件,但它们的帮助远不及专业的 IDE。 我不喜欢 IDE 的是缺乏交互性。 希望 Dataspell 将是两全其美的。
让我们尝试导入 Numpy,看看会发生什么:
支持自动代码提示——它完美无缺; 也支持代码未正确编写时的警告/错误,例如函数add_integers 应该返回一个整数,但它故意返回一个浮点数:
支持markdown
首先,将鼠标悬停在单元格上方并单击添加 Markdown 单元格:
另一种方法是单击代码下拉列表并将单元格类型切换为 Markdown。
下面是一些 Markdown 代码供您尝试:
这是运行单元格时的样子:
支持数据库
作为数据科学家,您几乎每天都必须建立和管理数据库连接。 当 SQL 写成字符串时,调试很长的 SQL 行并不容易。 Dataspell 有一个解决方案。以下是使用 sqlite3 包建立连接、创建数据库和表的方法:
您现在可以像往常一样插入数据:
Dataspell 的特别之处在于无需离开 IDE 或编写不必要的查询即可浏览数据库的选项。 只需双击数据库,就会打开一个新的侧窗口。从那里,您可以轻松单击任何感兴趣的表格,在单独的选项卡中浏览它: