UnicodeDecodeError：&#39；utf-8&#39；编解码器无法解码位置0中的字节0x80：无效的起始字节

2022-04-11 00:00:00 python byte utf-8 decode

问题描述

我正在使用pickle.dumps()保存列表：

my_list = ['Hello', 'I', 'Have', 'a', 'question', 'camión']
my_pickle = pickle.dumps(my_list)

创建泡菜后，我正在将其上载到Azure批处理中的容器：

blob_service.block_service.create_blob_from_bytes('containername', 'filename', my_pickle)

取回：

my_bytes = blob_service.block_service.get_blob_to_bytes('containername', 'filename')

我想要的(my_list)在my_bytes.content中，如果我打印出来，我会得到：

b'x80x03]qx00(Xx05x00x00x00Helloqx01Xx01x00x00x00Iqx02Xx04x00x00x00Haveqx03Xx01x00x00x00aqx04Xx08x00x00x00questionqx05Xx07x00x00x00camixc3xb3nqx06e.'

为了使my_bytes返回列表，我尝试按如下方式进行解码：

my_bytes.decode('utf-8')

但我收到以下错误：

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 0: invalid start byte

其他编码，如latin-1，未出错但返回

'x80x03]qx00(Xx05x00x00x00Helloqx01Xx01x00x00x00Iqx02Xx04x00x00x00Haveqx03Xx01x00x00x00aqx04Xx08x00x00x00questionqx05Xx07x00x00x00camiÃ³nqx06e.'

而不是my_list。

我在互联网上搜索了一下为什么会发生这种情况，但我找不到任何对我有帮助的东西，所以任何建议或建议都是非常受欢迎的。我想从my_bytes获取my_list。请注意，我对如何解码my_bytes感兴趣。

解决方案

我最后做的是将列表转换为字符串，如下所示：

my_list=str(my_list)

并将其上传到Blob存储：

BlockStorage('<account_name>', '<account_key>').block_service.create_blob_from_text('<container_name>', '<file_name>', my_list)

最后，下载：

my_file_as_str = BlockStorage('<account_name>', '<account_key>').block_service.get_blob_to_text('<container_name>', '<file_name>')

要拿回我的清单，我现在只需要做以下事情：

my_list = eval(my_file_as_str.content)

相关文章