这里使用永久ID解决的酸洗问题是什么?

2022-04-07 00:00:00 python python-3.x pickle

问题描述

发件人https://docs.python.org/3/library/pickle.html#persistence-of-external-objects

为了对象持久化的好处,fi模块支持 引用已选取数据流之外的对象的概念。 此类对象由永久ID引用,该ID应为 字母数字字符串(用于协议0)或仅为 任意对象(适用于任何较新的协议)。

如果有人能解释一下,我将不胜感激:这里使用永久ID解决的酸洗问题是什么?换句话说,如果不使用永久ID,酸洗会有什么问题?

具体地说,"引用到已筛选数据流之外的对象的概念"是什么意思?它是否与其他一些概念相反,例如"对已筛选数据流中的对象的引用"?


解决方案

Pickle数据流是对pickle.dumppickle.load做什么的泛化描述。例如,数据流是可以按顺序读取数据的文件。当所述流包含由Pickle生成或使用的数据时,它是Pickle数据流。

Pickle Stream具有内部引用的概念-如果同一对象在流中多次出现,则它只存储一次,然后仅被引用。但是,这仅指已存储在流中的内容--引用不能指向流外的对象,如原始对象。Pickle数据流的内容在概念上是其原始数据的副本。

import pickle

bar = (1, 2)
foo = {1: 1, 2: (1, 1), 'bar': bar}

with open('foo.pkl', 'wb') as out_stream:  # open a data stream...
     pickle.dump((bar, foo), out_stream)   # ...for pickle data

with open('foo.pkl', 'rb') as in_stream:
     bar2, foo2 = pickle.load(in_stream)

assert bar2 is foo2['bar']  # internal identity is preserved
assert bar is not bar2      # external identity is broken
持久化ID可用于引用流中不存在的对象--例如原始对象、全局数据库句柄、另一个流中的对象或类似对象。从概念上讲,持久化ID只是允许其他代码处理酸洗/取消酸洗。然而,永久ID的定义和实现取决于要解决的问题。

定义和使用永久ID并不困难。然而,它需要一些协调和簿记。非常简单的示例如下所示:

import pickle

# some object to persist
# usually, one would have some store or bookkeeping in place
bar = (1, 2)


# The create/load implementation of the persistent id
# extends pickling/unpickling
class PersistentPickler(pickle.Pickler):
    def persistent_id(self, obj):
        """Return a persistent id for the `bar` object only"""
        return "it's a bar" if obj is bar else None


class PersistentUnpickler(pickle.Unpickler):
    def persistent_load(self, pers_id):
        """Return the object identified by the persistent id"""
        if pers_id == "it's a bar":
           return bar
        raise pickle.UnpicklingError("This is just an example for one persistent object!")


# we can now dump and load the persistent object
foo = {'bar': bar}
with open("foo.pkl", "wb") as out_stream:
    PersistentPickler(out_stream).dump(foo)

with open("foo.pkl", "rb") as in_stream:
    foo2 = PersistentUnpickler(in_stream).load()

assert foo2 is not foo     # regular objects are not persistent
assert foo2['bar'] is bar  # persistent object identity is preserved

作为一个真实的例子,我以前的cpy2py module使用PICLE在不同的解释器之间交换数据。对于常规的类似值的对象,这意味着在一个解释器中序列化,在另一个解释器中反序列化。对于某些特殊的有状态对象,这意味着仅交换在所有连接的解释器中唯一标识该对象的永久ID。

涉及到一些记账,但您可以将本例中的persistent ID视为元组(process_id, object_id, object_type)。拥有该ID的解释器可以使用该ID来查找实际对象,而其他解释器可以改为创建占位符对象。这种情况下的全部要点是,状态不会被存储和复制,而只是被引用。

相关文章