這篇文章主要介紹了Python多線程下的變量問題,由于GIL的存在,Python的多線程編程問題一直是開發(fā)者中的熱點話題,需要的朋友可以參考下
在多線程環(huán)境下,每個線程都有自己的數(shù)據(jù)。一個線程使用自己的局部變量比使用全局變量好,因為局部變量只有線程自己能看見,不會影響其他線程,而全局變量的修改必須加鎖。
但是局部變量也有問題,就是在函數(shù)調用的時候,傳遞起來很麻煩:
def process_student(name):
std = Student(name)
# std是局部變量,但是每個函數(shù)都要用它,因此必須傳進去:
do_task_1(std)
do_task_2(std)
def do_task_1(std):
do_subtask_1(std)
do_subtask_2(std)
def do_task_2(std):
do_subtask_2(std)
do_subtask_2(std)
每個函數(shù)一層一層調用都這么傳參數(shù)那還得了?用全局變量?也不行,因為每個線程處理不同的Student對象,不能共享。
如果用一個全局dict存放所有的Student對象,然后以thread自身作為key獲得線程對應的Student對象如何?
global_dict = {}
def std_thread(name):
std = Student(name)
# 把std放到全局變量global_dict中:
global_dict[threading.current_thread()] = std
do_task_1()
do_task_2()
def do_task_1():
# 不傳入std,而是根據(jù)當前線程查找:
std = global_dict[threading.current_thread()]
...
def do_task_2():
# 任何函數(shù)都可以查找出當前線程的std變量:
std = global_dict[threading.current_thread()]
...
這種方式理論上是可行的,它最大的優(yōu)點是消除了std對象在每層函數(shù)中的傳遞問題,但是,每個函數(shù)獲取std的代碼有點丑。
有沒有更簡單的方式?
ThreadLocal應運而生,不用查找dict,ThreadLocal幫你自動做這件事:
import threading
# 創(chuàng)建全局ThreadLocal對象:
local_school = threading.local()
def process_student():
print 'Hello, %s (in %s)' % (local_school.student, threading.current_thread().name)
def process_thread(name):
# 綁定ThreadLocal的student:
local_school.student = name
process_student()
t1 = threading.Thread(target= process_thread, args=('Alice',), name='Thread-A')
t2 = threading.Thread(target= process_thread, args=('Bob',), name='Thread-B')
t1.start()
t2.start()
t1.join()
t2.join()
執(zhí)行結果:
Hello, Alice (in Thread-A)
Hello, Bob (in Thread-B)
全局變量local_school就是一個ThreadLocal對象,每個Thread對它都可以讀寫student屬性,但互不影響。你可以把local_school看成全局變量,但每個屬性如local_school.student都是線程的局部變量,可以任意讀寫而互不干擾,也不用管理鎖的問題,ThreadLocal內部會處理。
可以理解為全局變量local_school是一個dict,不但可以用local_school.student,還可以綁定其他變量,如local_school.teacher等等。
ThreadLocal最常用的地方就是為每個線程綁定一個數(shù)據(jù)庫連接,HTTP請求,用戶身份信息等,這樣一個線程的所有調用到的處理函數(shù)都可以非常方便地訪問這些資源。
更多信息請查看IT技術專欄