【python測試開發棧】python內存管理機制（一）—引用計數

Posted on 2019-12-122019-12-12 by admin

內容目錄

什麼是內存

在開始進入正題之前，我們先來回憶下，計算機基礎原理的知識，為什麼需要內存。我們都知道計算機的CPU相當於人類的大腦，其運算速度非常的快，而我們平時寫的數據，比如：文檔、代碼等都是存儲在磁盤上的。磁盤的存取速度完全不能匹配cpu的運算速度，因此就需要一个中間層來適配兩者的不對等，內存由此而來，內存的存取速率很快，但是存儲空間不大。

舉一個圖書館的例子，便於大家理解，我們圖書館的書架就相當於磁盤，存放了大量的圖書可以供我們閱讀，但是如果書放在書架上，我們沒辦法直接閱讀（效率低），只能將書取出來，放在書桌上看，那書桌就相當於內存。

內存回收

內存資源畢竟是有限的，所以在使用之後，必須被回收掉，否則系統運行一段時間后就會因無內存可用而癱瘓。我們軟件測試領域常用的兩種語言：java和python，全部都採用內存自動回收的方法，也就是我們只管申請內存，但是不管釋放內存，由jvm和python解釋器來定期觸發內存回收。作為對比，C語言和C++中，程序員需要使用malloc申請內存，使用free去釋放內存，malloc和free必須成對的出現，否則非常容易出現內存問題。

還拿上面圖書館的例子，假如圖書館的書看完之後放在書桌上就可以（因為圖書可自動回收），那麼很快的，就沒有位置給新進來的同學看書了。這時候就需要圖書館管理員（jvm或python解釋器）定期的回收圖書，清空書桌。不過正常情況下，我們離開圖書館時，要自己清空書桌，將書放回書架（類似C語言和C++的內存回收方式）。

python內存管理

引用計數

python通過引用計數來進行內存管理，每一個python對象，都維護了一個指向該對象的引用計數。python的sys庫提供了getrefcount()函數來獲取對象的引用計數。下面我們看個例子(注意：不同版本的python，運行結果不同，我這裏採用的是python3.7.4)：

"""
    @author: xuanke
    @time: 2019/11/27
    @function: 測試python內存
"""
import sys

class RefClass(object):
    def __init__(self):
        print("this is init")

def ref_count_test():
    # 驗證普通字符串
    str1 = "abc"
    print(sys.getrefcount(str1))
    # 驗證稍微複雜點的字符串
    print(sys.getrefcount("xuankeTester"))
    # 驗證小的数字
    print(sys.getrefcount(12))
    # 驗證大的数字
    print(sys.getrefcount(257))
    # 驗證類
    a = RefClass()
    print(sys.getrefcount(a))
    # 驗證引用計數增加
    b = a
    print(sys.getrefcount(a))

    # 驗證引用計數減少
    b = None
    print(sys.getrefcount(a))

if __name__ == '__main__':
    ref_count_test()

大家先來思考下，最終的結果會是什麼？！我覺得應該很多人都會答錯，因為不同版本的python，對引用變量個數有影響（主要是可復用的對象）。我們先貼出來運行結果，再來分析產生結果的原因：

27
4
9
3
this is init
2
3
2

不過提前聲明一點：sys.getrefcount函數在使用時，因為將對象（比如上例中的str1）作為參數傳入，所以會額外增加一個變量（相當於getrefcount持有了str1的引用），因此實際每個對象的實際引用計數都得減1。下面分別介紹下上面的幾種情況：

字符串： str1=’abc’的引用數是27-1=26，是因為字符串’abc’比較簡單，在python解釋器（CPython）中確實可能存在26個引用。作為對比，在python2.7中，str1的引用變量個數是3-1=2。而字符串’xuanketester’，是我自定義的一個字符串，所以不可能會有其他額外的引用，所以其引用變量個數是3-1=2（至於為什麼是2，理論應該是0，是因為python解釋器默認持有了所有字符串的兩個引用）。
数字： 数字12對應的引用計數個數是9-1=8，而257對應的引用計數個數是3-1=2，這主要是因為，在python初始化過程中，就創建了從-5到256的数字，緩存起來，這樣做是為了頻繁的分配內存，提高效率。而對於不在這個區間的数字，則會重新分配內存空間。所以数字12因為被複用，其引用計數個數是8（在python2.7.14中，其引用計數個數是8）。
類：在上面例子中，創建一個RefClass對象，其引用計數就是2-1=1，因為其是一個我們自定義的類對象，在python解釋器（Cpython）中肯定不會被複用。

我們可以通過打印內存地址的方式來驗證上面這幾種情況：

    def memory_address_test():
    str1 = 'xuankeTester'
    str2 = 'xuankeTester'
    print(id(str1))
    print(id(str2))

    str3 = 'abc'
    str4 = 'abc'
    print(id(str3))
    print(id(str4))

    a = 12
    b = 12
    print(id(a))
    print(id(b))

    c = 257
    d = 257
    print(id(c))
    print(id(d))

按照我們上面的分析，c和d的地址應該是不一樣的，a和b的地址是一樣的，字符串str1和str2、str3和str4內存地址都是一樣的。但是我在pycharm中，直接運行py文件，結果卻和預想的不一致，結果如下：

2854496960176
2854496960176
2854496857840
2854496857840
140724423258720
140724423258720
2854498931120
2854498931120

所有情況的內存地址都是一樣的，這是為什麼呢？我考慮到是不是pycharm對py文件做了優化，於是我又在命令行嘗試執行，結果還是一樣的。所以，我猜測可能是python解釋器在執行文件時，為了提高py文件的執行效率，對文件的內存地址做了優化—相同內容的對象內存地址都一樣。

為了驗證這個想法，我直接在python交互模式下執行，果然得到了我想要的結果：

Python 3.7.4 (tags/v3.7.4:e09359112e, Jul  8 2019, 20:34:20) [MSC v.1916 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> a=12
>>> b=12
>>> id(a)
140724423258720
>>> id(b)
140724423258720
>>> a=257
>>> b=257
>>> id(a)
2559155778384
>>> id(b)
2559155778192
>>> a='xuankeTester'
>>> b='xuankeTester'
>>> id(a)
2559155711280
>>> id(b)
2559155711280
>>>

從上面可以看到兩個257對應的地址確實是不一樣的，和我們最初判斷的是一致的。

總結

python通過對象的引用計數來管理內存，其實java的JVM也有用引用計數，所以理解了引用計數，為我們理解python的垃圾回收方法打下了基礎。本計劃這一篇文章就將python內存管理的機制講完的，但是發現一個內存引用計數就有很多東西得寫，所以索性就分兩篇文章來寫，之後再寫一篇文章來介紹python的垃圾回收方式。

本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理【其他文章推薦】

※3c收購,鏡頭收購有可能以全新價回收嗎?

※台北網頁設計公司這麼多，該如何挑選?? 網頁設計報價省錢懶人包"嚨底家"

※網頁設計公司推薦更多不同的設計風格，搶佔消費者視覺第一線

※想知道購買電動車哪裡補助最多?台中電動車補助資訊懶人包彙整

※賣IPHONE,iPhone回收,舊換新!教你怎麼賣才划算?

什麼是內存

內存回收

python內存管理

引用計數

總結

近期文章

標籤