熊猫1.0带来了重大突破



用于Python的数据分析库Pandas最终达到了1.0版本的候选标准。 Pandas 1.0删除了大量不推荐使用的功能,并且需要Python 3.6或更高版本。 创建Pandas的目的是轻松处理结构化格式的数据,例如表格,矩阵和时间序列数据。 Pandas使R数据框的许多功能黯然失色,并且可以与Python世界中的其他科学计算库很好地配合使用。 在Pandas 1.0中,Pandas的创建者引入了一系列突破性的更改,这些更改已经在作品中使用了一段时间。这里是最重要的清单,以及如何处理它们。 Pandas 1.0中最大的变化是放弃了对早于Python 3.6.1的所有版本的Python的支持。自2019年起,Pandas放弃了对Python 2的支持,并专门致力于Python 3,因此这主要是对现有政策的改进。 该项目还为未来版本的Pandas提供了新的支持政策。对Python版本的任何支持下降都将在Pandas的主要新版本(2.0、3.0等)中推出。次要版本将弃用功能,但不会删除它们。主要版本将删除功能。 熊猫的早期版本使用不同的类型来表示丢失的数据,具体取决于容器的类型-一种用于日期时间类型,一种用于对象等等。所有这些都被合并为一个称为NA的丢失数据类型。目前,对NA的支持仅限于几种对象类型,并且被认为是实验性的,因此尚不应该在生产中使用。 由于对Pandas 1.0进行了许多更改,因此某些Pandas API已向后不兼容。这包括对许多常见元素的行为的更改: 这些不兼容性中的许多都会引起警告,但是最好与Pandas 1.0对应项并排测试现有的Pandas脚本,以了解其运行方式。 Pandas的文档列出了Pandas 1.0中将要弃用但未删除的所有功能。其中一些仅被重命名或重组,例如测试模块,而其他一些则更改了某些功能参数的使用。在某些情况下,例如使用Series.item()和Index.item(),功能已被弃用,并且将继续可用。 如果您使用的Pandas版本早于0.25,则Pandas的创建者建议先迁移到Pandas 0.25,确保所有依赖于Pandas的代码都按预期运行,然后再迁移到Pandas 1.0。这是为了确保使用不推荐使用的功能的任何代码都将被标记。 在Pandas 1.0中已完全删除了一些重要的Pandas功能: 再次,这是与现有的Pandas安装并排测试Pandas 1.0版本候选者并确保脚本按预期运行的另一个原因。 通过输入pip install pandas,可以通过Pip软件包管理器直接在Python中安装Pandas 1.0。 Pandas 1.0也可以作为Anaconda Python发行版的一部分用于科学计算。 在所有情况下,最好将Pandas安装在虚拟环境中,特别是如果您要与较早版本的Pandas 1.0脚本并排运行测试。

Yorumlar

Bu blogdaki popüler yayınlar

GNAP:下一代OAuth

苹果将\u200b\u200b低级原子操作引入Swift语言

2个你不应该相信的云和AI神话