1、python实现并发并行编程的方式有三种:多线程、多进程、多协程
-
CPU密集型计算(CPU-bound);
CPU密集型也叫计算密集型,是指I/O在很短的时间内完成,CPU需要大量的计算和处理,特点就是CPU占用率相当高
如:压缩解压缩,加密解密,正则表达式搜索 -
I/O密集型计算(I/O-bound):
IO密集型是指系统运作大部分的状况是CPU在等IO(硬盘和内存)的读写操作,CPU占用率仍然很低
例如:文件处理程序,网络爬虫程序,读写数据库程序等 -
多进程(Process)
- 优点:可以利用多核CPU并行运算
- 缺点:占用资源最多,可启动数据比线程少
- 适用场景:CPU密集型计算
-
多线程
- 优点:相比进程,更轻量级,占用资源小
- 缺点:
- 相比进程:多线程只能并发,不能利用多CPU(GIL)
- 相比协程:启动数据有限制,占用内存资源,有线程切换开
- 适用场景:IO密集型计算,同时运行的任务数据要求不多
-
多协程
- 优点:内存开销最少,启动协程数量最多
- 缺点:支持的库有限制,代码实现复杂
- 适用于:IO密集型计算,需要超过任务运行,但有现成库支持的场景
2、三种方式的选择
- 1、首先判断是CPU密集型还是IO密集型,如果是CPU密集型,就选择多进程
- 2、如果是IO密集型,再看是否有超多任务要执行,是否有现成的协程库支持,如果是,就选择多协程,否则就选择多线程