Python 3.7:数据类的介绍

2023-01-31 01:01:05 python 数据 介绍


        python3.7预计在今年夏天发布,让我们一起偷瞄一眼它带来的新功能吧!如果你经常一个人在家用PyCharm撸代码,请确保将你的Pycharm升级到2018.1版本。(等你读完本文再升级也来得及)。

python3.7版本包含了众多新特性:比如对各种字符集的升级,推后了对注释的评价等等。其中最受期待的新特性是对数据类装饰器的支持。

什么是数据类

        绝大多数的python开发者都写过许多类,比如下图这样的。 


640?wx_fmt=png&wxfrom=5&wx_lazy=1

        数据类可以自动地给你定义的实例生成“魔术”方法。例如:__init__可以接收参数,并把参数分配给self。上图中的小例子也可以这样写: 

640?wx_fmt=png&wxfrom=5&wx_lazy=1

        其中关键的不同点在于,数据类实际上是要求类型提示的。如果你以前从未用到过类型提示:类型提示允许你标记代码中某一个变量应该是哪种数据类型的。在运行时,变量的数据类型不会被检查,但你可以用Pycharm或者命令行工具比如mypy来静态的检查你的代码。

那么,让我们看看如何使用这个新特性。

星球大战API

        你一定知道当一个电影粉丝用自己最爱的电影的数据创建了一个组REST api会让这个电影的粉丝团热情响应。一个星战粉丝就是这么干的,创建了星球大战API。实际上他做的更完善,直接为这个API创建了一个Python库。

        让我们暂时忘记这个包装库的存在,并探究一下如何创建我们自己的库。

        我们可以用request库从星球大战API中获取资源。

640?wx_fmt=png

        这个终端(和所有终端一样)用JSON格式的信息进行响应。Request库还提供jsON解析。

640?wx_fmt=png

        此时我们把数据存入到了一个字典中,让我们来看一下。

640?wx_fmt=png


封装这个API

        为了正确封装这个API,我们应该创建一个让用户可以在自己的应用使用的对象。所以让我们用Python3.6定义一个对象来存放对/films/终端请求的响应。

640?wx_fmt=png

        细心的读者可能已经注意到了上面的代码有一些冗余,不太细心的读者可以参考一下完整的Python3.6实现(可不短呦)。

这是一个数据类装饰器帮你摆脱困境的经典案例。我们创建了一个用来保存数据,只进行少量验证的类。接下来一起看看有哪些地方需要修改。

        首先,数据类自动的生成一些个魔术方法。如果我们没有指定任何数据类装饰器的选项,则自动生成的魔术方法为:__init__,__eq__,以及__repr__.如果你以及定义了__repr__,而不是__str__,那么python会默认地实现__str__以返回__repr__的输出结果。进而,你只要将代码如下图这样修改一下就得到了四种魔术方法:

640?wx_fmt=png

        在这里我们去掉了__init__方法来确保数据类装饰器可以添加它的子集。不幸的是在这一步中,我们还缺少了一个功能。我们的Python3.6构造函数不仅定义了所有的值,同时它还应该会尝试去解析数据。我们应该如何用数据类来实现这个功能呢?

如果我们重写__init__方法,那么就失去了用数据类的好处。因此,为了实现这些额外的处理,一个新的魔术方法__post_init__就诞生了。一起看下这个方法在我们要封装的对象中长什么样子:

640?wx_fmt=png

大功告成,在数据类装饰器的帮助下,我们仅用了原先1/3行数的代码就实现了我们的类。

更多的好处

    通过使用装饰器的选项,你可以进一步为自己的实例定制数据类。默认的选项是这样的:

640?wx_fmt=png

  • init选项决定是否生成__init__方法。

  • repr选项决定是否生成__repr__方法。

  • eq选项同上,其中__eq__方法定义了检查是否相等的操作。

  • order选项实际上生成了四个用来定义检查大于、小于、and、or操作的魔术方法,设置此项为True,你就可以对对象进行排序

        最后的两个选项决定了你的对象是否能被哈希。这是非常必要的,比如在你想用类的对象作为字典键时。哈希函数应该在对象的生命周期内一直生效,否则存储数据的字典就再也找不到你的对象了。数据类中的__hash__函数将会默认地返回数据类中所有对象的哈希值。因此,只有在你设置对象为只读时(令frozen=True)才会默认地生成__hash__函数。

        一旦使用frozen=True设置了只读属性,任何对你的对象进行写入的操作都会报错。如果你觉得这样太苛刻,并且还是想要确保对象永远不会被改变,那么可以设置unsafe_hash=True来代替frozen=True。数据类装饰器的开发者们不建议这样做。

如果你想更加深入的了解数据类,可以查阅PEP或者直接开始使用数据类玩耍啦。请在评论中告诉我们你都用数据类做了什么!


∞∞∞∞∞



640?wx_fmt=jpeg&wx_lazy=1

IT派 - {技术青年圈}持续关注互联网区块链人工智能领域640?wx_fmt=jpeg&wx_lazy=1



公众号回复“Python”,

邀你加入{ IT派Python技术群 } 


相关文章