深入理解Python内存管理与垃圾回收，再也不怕问了（二）-天翼云

深入理解Python内存管理与垃圾回收，再也不怕问了（二）

2023-04-07 07:04:34 阅读次数：457

深入理解Python内存管理与垃圾回收，再也不怕问了（二）

垃圾回收机制

来看一下Python中的垃圾回收技术：

引用计数为主
标记清除和分代回收为辅

如果一个对象的引用计数为0，Python解释器就会回收这个对象的内存，但引用计数的缺点是不能解决循环引用的问题，所以我们需要标记清除和分代回收。

什么是引用计数

每个对象都有存有指向该对象的引用总数
查看某个对象的引用计数sys.getrefcount()
可以使用del关键字删除某个引用

import sys

l = []
print(sys.getrefcount(l))	# Output: 2

l2 = l
l3 = l
l4 = l3
print(sys.getrefcount(l))	# Output: 5

del l2
print(sys.getrefcount(l))	# Output: 4

i = 1
print(sys.getrefcount(i))	# Output: 140

a = i
print(sys.getrefcount(i))	# Output: 141

当对象的引用计数达到零时，解释器会暂停，来取消分配它以及仅可从该对象访问的所有对象。即满足引用计数为0的时候，会启动垃圾回收。

但是引用计数不能解决循环引用的问题，就如下的代码不停跑就能把电脑内存跑满：

>>> a = []
>>> b = []
>>> while True:
...     a.append(b)
...     b.append(a)
...

[1]    31962 killed     python

标记清除

标记清除算法作为Python的辅助垃圾收集技术主要处理的是一些容器对象，比如list、dict、tuple，instance等，因为对于字符串、数值对象是不可能造成循环引用问题。标记清除和分代回收就是为了解决循环引用而生的。

它分为两个阶段：第一阶段是标记阶段，GC会把所有的活动对象打上标记，第二阶段是把那些没有标记的对象非活动对象进行回收。

对象之间通过引用（指针）连在一起，构成一个有向图，对象构成这个有向图的节点，而引用关系构成这个有向图的边。从根对象（root object）出发，沿着有向边遍历对象，可达的（reachable）对象标记为活动对象，不可达的对象就是要被清除的非活动对象。根对象就是全局变量、调用栈、寄存器。

深入理解Python内存管理与垃圾回收，再也不怕问了（二）

在上图中，可以从程序变量直接访问块1，并且可以间接访问块2和3。程序无法访问块4和5。第一步将标记块1，并记住块2和3以供稍后处理。第二步将标记块2，第三步将标记块3，但不记得块2，因为它已被标记。扫描阶段将忽略块1，2和3，因为它们已被标记，但会回收块4和5。

标记清除算法作为Python的辅助垃圾收集技术，主要处理的是一些容器对象，比如list、dict、tuple等，因为对于字符串、数值对象是不可能造成循环引用问题。

Python使用一个双向链表将这些容器对象组织起来。不过，这种简单粗暴的标记清除算法也有明显的缺点：清除非活动的对象前它必须顺序扫描整个堆内存，哪怕只剩下小部分活动对象也要扫描所有对象。

分代回收(自动)

分代回收是建立在标记清除技术基础之上的，是一种以空间换时间的操作方式。

Python将所有的对象分为0，1，2 三代
所有的新建的对象都是0代对象
当某一代对象经历过垃圾回收，依然存活，那么它就被归入下一代对象。

同时，分代回收是建立在标记清除技术基础之上。分代回收同样作为Python的辅助垃圾收集技术处理那些容器对象。

Python运行时，会记录其中分配对象(object allocation)和取消分配对象(object deallocation)的次数。

当两者的差值高于某个阈值时，垃圾回收才会启动

查看阈值gc.get_threshold()

import gc

print(gc.get_threshold())  # Output: (700, 10, 10)

get_threshold()返回的(700, 10, 10)返回的两个10。也就是说，每10次0代垃圾回收，会配合1次1代的垃圾回收；而每10次1代的垃圾回收，才会有1次的2代垃圾回收。理论上，存活时间久的对象，使用的越多，越不容易被回收，这也是分代回收设计的思想。

手动回收

具体参考gc模块。

gc.collect()手动回收
objgraph模块中的count()记录当前类产生的实例对象的个数

import gc
result = gc.collect()

print(result)

import objgraph

class Person(Object):
  pass

class Cat(object):
  pass

p = Person()
c = Cat()
p.name ='yuzhou1su'

c.master = p
print(sys.getrefcount(p))
print(sys.getfefcount(c))

del p
del c

gc.collect()
print(objgraph.count('Person'))
print(objgraph.count('Cat'))

当定位到哪个对象存在内存泄漏，就可以用show_backrefs查看这个对象的引用链。

内存池(memory pool)机制

频繁申请、消耗会导致大量的内存碎片，致使效率变低。

内存池的概念就是在内存中申请一定数量的，大小相等的内存块留作备用。

内存池池由单个大小类的块组成。每个池维护一个到相同大小类的其他池的双向链接列表。这样，即使在不同的池中，该算法也可以轻松找到给定块大小的可用空间。

当有新的内存需求时，就会先从内存池中分配内存留给这个需求。内存不够再申请新的内存。

内存池本身必须处于以下三种状态之一：

已使用
已满
或为空。

优点：减少内存碎片，提高效率。

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

深入理解Python内存管理与垃圾回收，再也不怕问了（二）

深入理解Python内存管理与垃圾回收，再也不怕问了（二）

什么是引用计数

标记清除

分代回收(自动)

手动回收

内存池(memory pool)机制

相关文章

python四种抽样方法的使用：随机抽样、聚类抽样、系统抽样、分层抽样

视频 | Python测试开发之调试print代码实例

python简单介绍及基础知识（一）

使用Python扩展PAM（part 2）

1行Python代码，把Excel转成PDF，python-office功能更新~

IronPython 与 c# 交互之导入Python模块的两种方法

python性能测试之pyperformance

Python高维统计建模变量选择:SCAD平滑剪切绝对偏差惩罚、Lasso惩罚函数比较

一篇文章教会你Python中三种简单函数的使用

一篇文章带你剖析Python 字节流处理神器struct

作者介绍

最新文章

python四种抽样方法的使用：随机抽样、聚类抽样、系统抽样、分层抽样

python简单介绍及基础知识（一）

视频 | Python测试开发之调试print代码实例

使用Python扩展PAM（part 2）

1行Python代码，把Excel转成PDF，python-office功能更新~

IronPython 与 c# 交互之导入Python模块的两种方法

热门文章

Linux实用命令authconfig和authconfig-tui（备忘）

Python高级变量类型

python学习——面向对象编程

一个简单的http server，处理get和post请求，Python实现

Python数据库测试实战教程

Python编程：生成器yield与yield from区别简单理解

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

Python基础语法入门篇(二)

Huffman哈夫曼树编码字符，binarytree，Python

【Python Practice】Day 14 Question 51-53

Python 语言基础变量获得变量类型

用代码转换整数规划 max{ } 与 min{ } 形式至代码形式

Python| 函数中运用递归方式求解