python 处理中文 读取数据库输出全是问号
ref:http://www.cnblogs.com/zhoujie/archive/2013/06/07/problem1.html
1、python连接mssql数据库编码问题
python一直对中文支持的不好,最近老遇到编码问题,而且几乎没有通用的方案来解决这个问题,但是对常见的方法都试过之后,发现还是可以解决的,下面总结了常用的支持中文的编码问题(这些方法中可能其中一个就能解决问题,也可能是多个组合)。
(1)、首先,要保证文件的开头要加上编码设置来说明文件的编码
#encoding=utf-8
(2)、然后,在连接数据的连接参数里加上字符集说明查询出的结果的编码,这个不加的后果可能是查询出的汉字字符都是问号
conn=pymssql.connect(server=".",user="", password="",database="MyTest",charset="utf8")
(3)、设置python系统的默认编码(对于文件来说,这招几乎屡试不爽,呵呵~~)
import sys reload(sys) sys.setdefaultencoding("utf8")
注意:上述编码是“utf8”,而不是“utf-8”,我也没弄明白,大部分情况下,这个无所谓的,但是这里我试了必须要是“utf8”
一个简单的完整的python连接mssqlserver的例子如下(得安装pymssql包):

1 #encoding:utf8 2 import sys 3 reload(sys) 4 sys.setdefaultencoding("utf8") 5 import pymssql 6 try: 7 conn=pymssql.connect(server=".",user="", password="",database="MyTest",charset="utf8") 8 sql="select * from UserInfo" 9 10 cur=conn.cursor() 11 cur.execute(sql) 12 data=cur.fetchall() 13 conn.close() 14 print data
15 except Exception,e: 16 print e

运行结果如下:
[(u"20093501", u"xb9xf9xbexb8", u"u7537 ", 35, u"xb4xf3xcfxc0"),
(u"20093502", u"xbbxc6xc8xd8", u"u5973 ", 34, u"xc3xc0xc5xae"),
(u"20093503", u"xc1xeexbaxfcxb3xe5", u"u7537 ", 25, u"2Bxc7xe0xc4xea"),
(u"20093504", u"xc8xcexd3xafxd3xaf", u"u5973 ", 24, u"xc6xafxc1xc1")] [Finished in 0.2s]
虽然摆脱了问号和乱码的困扰,但这仍不是我们想要的结果,但这个确实是正确的,因为结果是utf8编码。这个现象确实诡异,请教了许多高手,得知,最好的结果就是逐个字段查询,才能显示中文,整个查询的话,会以utf8的格式显示出来。
上述代码中第14行data是整个查询的结果,如果指定某个具体的字段,如print data[0][2](表示取查询结果的第一行第三列的字段的值),则会输出中文。
其实不仅仅是mssqlserver数据库,mysql(需下载MySQLdb包)、sqllite(python自带的文件数据库)、mongodb(需下载PyMongo包)等或者是普通文本文件也是类似的解决方案。
2、参数*args和和**kwargs
这是一个Python特性,类似C#和C++中的参数数组(param[]),允许函数接受动态的、可变数量的、参数名只在运行时可知的参数。 如果在函数定义时,只在参数前面加一个*号,所有传递给函数的参数将会保存为一个元组. 如果在函数定义时,在参数前面加两个*号,所有传递给函数的关键字参数,将会保存为一个字典
def foo(*args, **kwargs): print "Positional arguments are:" print args print "Keyword arguments are:" print kwargs
调用它,看看它是如何工作的:

>>> foo(1, 2, 3) Positional arguments are: (1, 2, 3) Keyword arguments are: {} >>> foo(1, 2, name="Adrian", framework="Django") Positional arguments are: (1, 2) Keyword arguments are: {"framework": "Django", "name": "Adrian"}

- 上一篇: JS引擎-- Chrome V8 引擎入门
- 下一篇: java中的字符串可以直接用+连接