循环图像,保存ID名称,并将其相应地存储在数据帧中
问题描述
您好,
简介:
我正在尝试设置一个 pandas 数据框来将一些离散的化学值连接到一些图像。这比我目前的水平略高,所以我希望在这里得到一些帮助。
我到目前为止得到的:
我目前已经从提供的数据表中切出了两列,如下所示。
现在,我在这里有1688个数据点,并且有1225个10x10x4(RGBA)大小的图像要与其关联。(1225,10,10,4)Uint8这些图像在第1列中都具有相同的SAMPLE_ID名称。我的目标是运行一个循环,从文件夹中取出图像,将其展平并重塑为300x1,然后将它们存储在第三列中,该列将根据SAMPLE_ID进行检查。这意味着正确的图像必须与正确的SAMPLE_ID相对应。
我已经搜索了网络,这里是StackOverflow。我已经从这里尝试了4个不同的循环图像函数,但没有得到我所期望的结果。
到目前为止,我最好的办法似乎是使用GLOB将所有内容都放在一个模糊的文件中。但我肯定需要一个循环函数来将图像与相应的id和Ni值链接起来。
有关如何加载图像并存储其ID值以便与现有数据帧进行交叉引用的任何建议。
感谢您抽出时间。
解决方案
假定图像ID在其名称中,并使用matplotlib.image.imread
path = '.' # current directory
filenames = [os.path.abspath(os.path.join(path, x)) for x in os.listdir(path) if '.png' in x or '.jpg' in x]
>>> filenames
['image_0.png',
'image_1.png',
'image_2.png',
'image_3.png',
'image_4.png',
'image_5.png',
'image_6.png',
'image_7.png',
'image_8.png',
'image_9.png']
将图像读入数据帧并将其名称添加为一列:
from matplotlib.image import imread
images_df = pd.DataFrame([[imread(filename).flatten()] for filename in filenames], columns=['images'])
images_df['id'] = filenames
images_df['id'] = images_df['id'].apply(os.path.basename)
>>> images_df
images id
0 [0.4627451, 0.05490196, 0.8745098, 0.79607844,... image_0.png
1 [0.20784314, 0.93333334, 0.73333335, 0.6156863... image_1.png
2 [0.4117647, 0.3254902, 0.8784314, 0.16470589, ... image_2.png
3 [0.8627451, 0.6862745, 0.78431374, 0.6431373, ... image_3.png
4 [0.44705883, 0.627451, 0.57254905, 0.78431374,... image_4.png
5 [0.7490196, 0.007843138, 0.25490198, 0.1372549... image_5.png
6 [0.039215688, 0.14901961, 0.5882353, 0.5137255... image_6.png
7 [0.24705882, 0.94509804, 0.1882353, 0.38039216... image_7.png
8 [0.35686275, 0.047058824, 0.56078434, 0.062745... image_8.png
9 [0.8, 0.23921569, 0.99607843, 0.89411765, 0.23... image_9.png
从图像中提取ID:
>>> images_df['id'] = images_df['id'].str.split('.').str[0]
0 image_0
1 image_1
2 image_2
3 image_3
4 image_4
5 image_5
6 image_6
7 image_7
8 image_8
9 image_9
Name: id, dtype: object
images_df['id']
如果Sample_ID
为1,则需要转换为整数。
加入数据帧:
pd.merge(images_df, new_data_rdy, left_on='id', right_on='Sample_ID')
相关文章