這篇文章主要介紹了Python中的序列化存儲的方法,序列化存儲主要針對的是內(nèi)存和硬盤之間的寫入操作,需要的朋友可以參考下
在程序運(yùn)行的過程中,所有的變量都是在內(nèi)存中,比如,定義一個(gè)dict:
d = dict(name='Bob', age=20, score=88)
可以隨時(shí)修改變量,比如把name改成'Bill',但是一旦程序結(jié)束,變量所占用的內(nèi)存就被操作系統(tǒng)全部回收。如果沒有把修改后的'Bill'存儲到磁盤上,下次重新運(yùn)行程序,變量又被初始化為'Bob'。
我們把變量從內(nèi)存中變成可存儲或傳輸?shù)倪^程稱之為序列化,在Python中叫pickling,在其他語言中也被稱之為serialization,marshalling,flattening等等,都是一個(gè)意思。
序列化之后,就可以把序列化后的內(nèi)容寫入磁盤,或者通過網(wǎng)絡(luò)傳輸?shù)絼e的機(jī)器上。
反過來,把變量內(nèi)容從序列化的對象重新讀到內(nèi)存里稱之為反序列化,即unpickling。
Python提供兩個(gè)模塊來實(shí)現(xiàn)序列化:cPickle和pickle。這兩個(gè)模塊功能是一樣的,區(qū)別在于cPickle是C語言寫的,速度快,pickle是純Python寫的,速度慢,跟cStringIO和StringIO一個(gè)道理。用的時(shí)候,先嘗試導(dǎo)入cPickle,如果失敗,再導(dǎo)入pickle:
try:
import cPickle as pickle
except ImportError:
import pickle
首先,我們嘗試把一個(gè)對象序列化并寫入文件:
>>> d = dict(name='Bob', age=20, score=88)
>>> pickle.dumps(d)
"(dp0\nS'age'\np1\nI20\nsS'score'\np2\nI88\nsS'name'\np3\nS'Bob'\np4\ns."
pickle.dumps()方法把任意對象序列化成一個(gè)str,然后,就可以把這個(gè)str寫入文件?;蛘哂昧硪粋€(gè)方法pickle.dump()直接把對象序列化后寫入一個(gè)file-like Object:
>>> f = open('dump.txt', 'wb')
>>> pickle.dump(d, f)
>>> f.close()
看看寫入的dump.txt文件,一堆亂七八糟的內(nèi)容,這些都是Python保存的對象內(nèi)部信息。
當(dāng)我們要把對象從磁盤讀到內(nèi)存時(shí),可以先把內(nèi)容讀到一個(gè)str,然后用pickle.loads()方法反序列化出對象,也可以直接用pickle.load()方法從一個(gè)file-like Object中直接反序列化出對象。我們打開另一個(gè)Python命令行來反序列化剛才保存的對象:
>>> f = open('dump.txt', 'rb')
>>> d = pickle.load(f)
>>> f.close()
>>> d
{'age': 20, 'score': 88, 'name': 'Bob'}
變量的內(nèi)容又回來了!
當(dāng)然,這個(gè)變量和原來的變量是完全不相干的對象,它們只是內(nèi)容相同而已。
Pickle的問題和所有其他編程語言特有的序列化問題一樣,就是它只能用于Python,并且可能不同版本的Python彼此都不兼容,因此,只能用Pickle保存那些不重要的數(shù)據(jù),不能成功地反序列化也沒關(guān)系。
更多信息請查看IT技術(shù)專欄