19 Nov 2009

coding in python cp936

解析一个中文xmlfile,发现print的时候字符串连接之后会出错
但是在IDLE里面,同样的语句却正常print
比较疑惑,虽然明白是编码问题,但是被unicode,utf-8和gb2312搞得郁闷死
后来索性删除
# -*- coding: utf-8 -*-
这一行,结果运行时弹出提示,选择edit my file之后,完全正确.
惊喜之余,看看IDLE给自动加了一行
# -*- coding: cp936 -*-


这个cp936是虾米东东?

google了一下发现,原来它就是传说中的GBK
而GB2312是GBK的一个真子集
更多关于cp936也就是GBK的内容,可以参考
这里
http://msdn.microsoft.com/zh-cn/goglobal/bb964654%28en-us%29.aspx

或者这里
http://zh.wikipedia.org/wiki/GBK


No comments :

Post a Comment