在池映射中使用列表/多个参数的Python
问题描述
我正在尝试将列表作为参数传递给pool.map(co_refresh, input_list)
。但是,pool.map
没有触发函数co_refresh
。并且也没有返回错误。看起来进程挂在那里。
原始代码:
from multiprocessing import Pool
import pandas as pd
import os
account='xxx'
password='xxx'
threads=5
co_links='file.csv'
input_list=[]
pool = Pool(processes=threads)
def co_refresh(url, account, password, outputfile):
print(url + ' : ' + account + ' : ' + password + ' : ' + outputfile)
return;
link_pool = pd.read_csv(co_links, skipinitialspace = True)
for i, row in link_pool.iterrows():
ln = (row.URL, account, password, os.path.join('e:/', row.File_Name.split('.')[0] + '.csv'))
input_list.append(ln)
pool.map(co_refresh, input_list)
pool.close()
但是,它从未触发函数co_refresh
。如何将该列表用作传递给我的函数的参数?
旧问题(简化):
我有以下INPUT_LIST,它是list
的list
:
[a1, b1, c1, d1]
[a2, b2, c2, d2]
[a3, b3, c3, d3]
我有如下功能:
def func(a, b, c, d)
###
return;
我想为此函数使用多进程func
:
from multiprocessing import Pool
pool = Pool(processes=5)
pool.map(func, input_list)
pool.close()
但是,它从未触发函数func
。如何将该列表用作传递给我的函数的参数?
解决方案
您应该在声明Pool
之前定义您的工作函数,当您声明Pool
,sub worker processes forked时,工作进程不会执行该行以外的代码,因此看不到您的工作函数。
此外,您最好将pool.map
替换为pool.starmap
以适合您的输入。
简化示例:
from multiprocessing import Pool
def co_refresh(a, b, c, d):
print(a, b, c, d)
input_list = [f'a{i} b{i} c{i} d{i}'.split() for i in range(4)]
# [['a0', 'b0', 'c0', 'd0'], ['a1', 'b1', 'c1', 'd1'], ['a2', 'b2', 'c2', 'd2'], ['a3', 'b3', 'c3', 'd3']]
pool = Pool(processes=3)
pool.starmap(co_refresh, input_list)
pool.close()
相关文章