文章内容

2017/9/12 10:50:41,作 者: 黄兵

python \uxxxx转中文

[u'\u8096\u7533\u514b\u7684\u6551\u8d4e The Shawshank Redemption']
[u'\u8fd9\u4e2a\u6740\u624b\u4e0d\u592a\u51b7 L\xe9on']
[u'\u963f\u7518\u6b63\u4f20 Forrest Gump']
[u'\u9738\u738b\u522b\u59ec']

类似这样的类容怎么可以把它转为中文呢

以\u9738\u738b\u522b\u59ec为例

>>> print u'\u9738\u738b\u522b\u59ec'
霸王别姬

其实本来就是中文,采用python内码。

转成gbk或utf8

>>> s.encode('gbk')
'\xb0\xd4\xcd\xf5\xb1\xf0\xbc\xa7'
>>> s.encode('utf8')
'\xe9\x9c\xb8\xe7\x8e\x8b\xe5\x88\xab\xe5\xa7\xac'
>>> print s.encode('gbk')
霸王别姬
>>> print s.encode('utf8')
霸王别姬


分享到:

发表评论

评论列表