从U3数据类型转换为ASCII
问题描述
我正在从.mat文件读取数据。数据的格式为Numpy数组。
[array([u'ABT'], dtype='<U3')]
这是数组的一个元素。我只想从数组中获取值‘abt’。Unicode规范化和编码为ASCII函数不起作用。
解决方案
encode
是字符串方法,因此不能直接处理字符串数组。但是有几种方法可以将其应用于每个字符串
这里我使用的是Py3,所以默认值为Unicode。
In [179]: A=np.array(['one','two'])
In [180]: A
Out[180]:
array(['one', 'two'],
dtype='<U3')
普通迭代:
In [181]: np.array([s.encode() for s in A])
Out[181]:
array([b'one', b'two'],
dtype='|S3')
np.char
具有将字符串方法应用于数组的每个元素的函数:
In [182]: np.char.encode(A)
Out[182]:
array([b'one', b'two'],
dtype='|S3')
但看起来这是astype
可以处理的转换之一:
In [183]: A.astype('<S3')
Out[183]:
array([b'one', b'two'],
dtype='|S3')
并受到最近关于np.chararray
的一个问题的启发:
What happened to numpy.chararray
In [191]: Ac=np.char.array(A)
In [192]: Ac
Out[192]:
chararray(['one', 'two'],
dtype='<U3')
In [193]: Ac.encode()
Out[193]:
array([b'one', b'two'],
dtype='|S3')
相关文章