python多进程中apply和apply_async用法详解-天翼云

python多进程中apply和apply_async用法详解

2023-06-01 06:31:14 阅读次数：129

python在同一个线程中多次执行同一方法时，假设该方法执行耗时较长且每次执行过程及结果互不影响，如果只在主进程中执行，效率会很低，因此使用multiprocessing.Pool(processes=n)及其apply_async()方法提高程序执行的并行度从而提高程序的执行效率,其中processes=n为程序并行执行的进程数。

apply（）方法是阻塞的，也就是说等待当前子进程执行完毕后，再执行下一个进程。

示例代码：

import time
import multiprocessing


def apply_test(s):
    time.sleep(3)
    print('info: %s' % s)


if __name__ == '__main__':
    print('开始主进程。。。')
    start = time.time()
    # 使用线程池建立3个子进程
    pool = multiprocessing.Pool(3)
    print('开始3个子进程。。。')
    for i in range(3):
        pool.apply(apply_test, [i])
    print('主进程结束，耗时 %s' % (time.time() - start))

运行结果：

python多进程中apply和apply_async用法详解

apply_async（）是异步非阻塞式，不用等待当前进程执行完毕，随时跟进操作系统调度来进行进程切换，即多个进程并行执行，提高程序的执行效率。

示例代码1：

import time
import multiprocessing


def apply_test(s):
    time.sleep(3)
    print('info: %s' % s)


if __name__ == '__main__':
    print('开始主进程。。。')
    start = time.time()
    # 使用线程池建立3个子进程
    pool = multiprocessing.Pool(3)
    print('开始3个子进程。。。')
    for i in range(3):
        pool.apply_async(apply_test, [i])
    print('主进程结束，耗时 %s' % (time.time() - start))
    
    # 为了演示效果，这儿使用休眠方式
    time.sleep(10)

运行结果：

python多进程中apply和apply_async用法详解

示例代码2：【主进程等待子进程都结束再结束】

import time
import multiprocessing


def apply_test(s):
    time.sleep(3)
    print('info: %s' % s)


if __name__ == '__main__':
    print('开始主进程。。。')
    start = time.time()
    # 使用线程池建立3个子进程
    pool = multiprocessing.Pool(3)
    print('开始3个子进程。。。')
    for i in range(3):
        pool.apply_async(apply_test, [i])
    pool.close()
    pool.join()
    print('主进程结束，耗时 %s' % (time.time() - start))

运行结果：

python多进程中apply和apply_async用法详解

示例代码3：

import time
import random
import multiprocessing


def func(x):
    ts = random.randint(1, 10)
    time.sleep(ts)
    print(f'{x}执行完毕！耗时{ts}s')


if __name__ == '__main__':
    pool = multiprocessing.Pool(6)
    for i in range(6):
        print(f"开始执行第{i}个任务...")
        pool.apply_async(func, args=(i, ))
    pool.close()
    pool.join()

运行结果：

python多进程中apply和apply_async用法详解

在使用apply_async()方法接收多个参数的方法时，在任务方法中正常定义多个参数，参数以元组形式传入即可但是给apply_async()方法传入多个值获取多个迭代结果时就会报错，因为该方法只能接收一个值，所以可以将该方法放入一个列表生成式中。

示例代码4：

import multiprocessing


def func(x):
    return x ** 2


if __name__ == '__main__':
    pool = multiprocessing.Pool()
    res = [pool.apply_async(func, (i, )) for i in range(6)]
    print([x for x in res])
    print([x.get() for x in res])
    pool.close()
    pool.join()

运行结果：

python多进程中apply和apply_async用法详解

有时候在使用多进程或者多线程执行程序时，当程序有bug时，某个进程或者线程可能会挂掉，但是自己又不容易或者很难发现是哪个线程或进程挂掉了。如示例代码5所示：

示例代码5：

import time
import random
import multiprocessing


def func(x, y):
    ret = x / y
    return ret


def task(i):
    ts = random.randint(1, 10)
    time.sleep(ts)
    nums = [-1, 0, 1, 2]
    x, y = random.choice(nums), random.choice(nums)
    value = func(x, y)
    print(f'{i}执行完毕！耗时{ts}s,结果为{value}')


if __name__ == '__main__':
    pool = multiprocessing.Pool(6)
    for i in range(6):
        print(f"开始执行第{i}个任务...")
        pool.apply_async(task, args=(i,))
    pool.close()
    pool.join()

运行结果：

python多进程中apply和apply_async用法详解

在上述例子中，我们是打印了某个进程号，但真正项目中是不会这样打印日志的，就很难发现某个进程或者线程已经挂掉了，这时候需要使用回调函数，打印某个进程或者线程挂掉的error信息，如示例代码6所示。

示例代码6：

import time
import random
import multiprocessing


def func(x, y):
    ret = x / y
    return ret


def task(i):
    ts = random.randint(1, 10)
    time.sleep(ts)
    nums = [-1, 0, 1, 2]
    x, y = random.choice(nums), random.choice(nums)
    value = func(x, y)
    print(f'{i}执行完毕！耗时{ts}s,结果为{value}')


def error_callback(error):
    print(f"Error info: {error}")


if __name__ == '__main__':
    pool = multiprocessing.Pool(6)
    for i in range(6):
        print(f"开始执行第{i}个任务...")
        pool.apply_async(task, args=(i,), error_callback=error_callback)
    pool.close()
    pool.join()

运行结果：

python多进程中apply和apply_async用法详解

上述执行结果就很容易看出进程或者线程在运行过程中有挂掉的，而且打印出了挂掉的原因，也有利用我们后期排除程序中的bug。

同样的，除了想让报错的程序回调一下，同时也想让异步函数执行完毕也给一个回调响应值，这时可以加上callback参数，响应结果，如示例代码7所示。

示例代码7：

import time
import random
import multiprocessing


def func(x, y):
    ret = x / y
    return ret


def task(i):
    ts = random.randint(1, 10)
    time.sleep(ts)
    nums = [-1, 0, 1, 2]
    x, y = random.choice(nums), random.choice(nums)
    value = func(x, y)
    # print(f'{i}执行完毕！耗时{ts}s,结果为{value}')
    return f'{i}执行完毕！耗时{ts}s,结果为{value}'


def error_callback(error):
    print(f"Error info: {error}")


def call_back(info):
    print(f"Right info: {info}")


if __name__ == '__main__':
    pool = multiprocessing.Pool(6)
    for i in range(6):
        print(f"开始执行第{i}个任务...")
        pool.apply_async(task, args=(i,), callback=call_back, error_callback=error_callback)
    pool.close()
    pool.join()

运行结果：

python多进程中apply和apply_async用法详解

注意：join()等待所有子进程结束后再运行，使用join()前先使用close()关闭它。

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

python多进程中apply和apply_async用法详解

python多进程中apply和apply_async用法详解

相关文章

python四种抽样方法的使用：随机抽样、聚类抽样、系统抽样、分层抽样

视频 | Python测试开发之调试print代码实例

python简单介绍及基础知识（一）

使用Python扩展PAM（part 2）

Java线程的基础概念介绍（结合代码说明）

1行Python代码，把Excel转成PDF，python-office功能更新~

IronPython 与 c# 交互之导入Python模块的两种方法

python性能测试之pyperformance

Python高维统计建模变量选择:SCAD平滑剪切绝对偏差惩罚、Lasso惩罚函数比较

一篇文章教会你Python中三种简单函数的使用

作者介绍

最新文章

ogg之创建隔离多通道复制

【python基础】学习路线

win查找被占用端口

【GDB】GDB工作原理--ptrace(让父进程可观察和控制其它进程、检查和改变其核心映像及寄存器）

【多进程】Linux中fork()函数详解|多进程

linux管道pipe详解

热门文章

python list转dict

定义一个函数，接收三个参数返回一元二次方程

python 倒排索引(Inverted Index)

python取两个列表的并集、交集、差集

解决numpy报错UFuncTypeError: Cannot cast ufunc ‘add‘ output from dtype(‘x‘) to dtype(‘x‘)

python使用xlwt创建与保存excel文件

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

python 获取图像边缘轮廓

使用python实现SQL server的暴力破解

py执行时超时控制

pandas根据行名称、列名称，得到对应的下标

Django（22）-ORM中F对象和Q对象

binarytree二叉树节点BFS广度优先搜索遍历，基于队列，非递归，python