python一直對(duì)中文支持的不好,最近老遇到編碼問(wèn)題,而且?guī)缀鯖](méi)有通用的方案來(lái)解決這個(gè)問(wèn)題,但是對(duì)常見(jiàn)的方法都試過(guò)之后,發(fā)現(xiàn)還是可以解決的,下面總結(jié)了常用的支持中文的編碼問(wèn)題(這些方法中可能其中一個(gè)就能解決問(wèn)題,也可能是多個(gè)組合)。
(1)、首先,要保證文件的開(kāi)頭要加上編碼設(shè)置來(lái)說(shuō)明文件的編碼
代碼如下:
#encoding=utf-8
(2)、然后,在連接數(shù)據(jù)的連接參數(shù)里加上字符集說(shuō)明查詢出的結(jié)果的編碼,這個(gè)不加的后果可能是查詢出的漢字字符都是問(wèn)號(hào)
代碼如下:
conn=pymssql.connect(server='.',user='', password='',database='MyTest',charset='utf8')
(3)、設(shè)置python系統(tǒng)的默認(rèn)編碼(對(duì)于文件來(lái)說(shuō),這招幾乎屢試不爽,呵呵~~)
代碼如下:
import sys
reload(sys)
sys.setdefaultencoding('utf8')
注意:上述編碼是“utf8”,而不是“utf-8”,我也沒(méi)弄明白,大部分情況下,這個(gè)無(wú)所謂的,但是這里我試了必須要是“utf8”
一個(gè)簡(jiǎn)單的完整的python連接mssqlserver的例子如下(得安裝pymssql包):
代碼如下:
#encoding:utf8
import sys
reload(sys)
sys.setdefaultencoding('utf8')
import pymssql
try:
conn=pymssql.connect(server='.',user='', password='',database='MyTest',charset='utf8')
sql="select * from UserInfo"
cur=conn.cursor()
cur.execute(sql)
data=cur.fetchall()
conn.close()
print data
except Exception,e:
print e
運(yùn)行結(jié)果如下:
代碼如下:
[(u'20093501', u'\xb9\xf9\xbe\xb8', u'\u7537 ', 35, u'\xb4\xf3\xcf\xc0'),
(u'20093502', u'\xbb\xc6\xc8\xd8', u'\u5973 ', 34, u'\xc3\xc0\xc5\xae'),
(u'20093503', u'\xc1\xee\xba\xfc\xb3\xe5', u'\u7537 ', 25, u'2B\xc7\xe0\xc4\xea'),
(u'20093504', u'\xc8\xce\xd3\xaf\xd3\xaf', u'\u5973 ', 24, u'\xc6\xaf\xc1\xc1')]
[Finished in 0.2s]
雖然擺脫了問(wèn)號(hào)和亂碼的困擾,但這仍不是我們想要的結(jié)果,但這個(gè)確實(shí)是正確的,因?yàn)榻Y(jié)果是utf8編碼。這個(gè)現(xiàn)象確實(shí)詭異,請(qǐng)教了許多高手,得知,最好的結(jié)果就是逐個(gè)字段查詢,才能顯示中文,整個(gè)查詢的話,會(huì)以u(píng)tf8的格式顯示出來(lái)。
上述代碼中第14行data是整個(gè)查詢的結(jié)果,如果指定某個(gè)具體的字段,如print data[0][2](表示取查詢結(jié)果的第一行第三列的字段的值),則會(huì)輸出中文。
其實(shí)不僅僅是mssqlserver數(shù)據(jù)庫(kù),mysql(需下載MySQLdb包)、sqllite(python自帶的文件數(shù)據(jù)庫(kù))、mongodb(需下載PyMongo包)等或者是普通文本文件也是類似的解決方案。
更多信息請(qǐng)查看IT技術(shù)專欄