在使用json.dumps时要注意一个问题
1 2 3 |
>>> import json >>> print(json.dumps('中国')) "\u4e2d\u56fd" |
输出的会是
‘中国’ 中的ascii字符码,而不是真正的中文。
这是因为json.dumps序列化时对中文默认使用的ascii编码
想输出真正的中文需要指定ensure_ascii=False:
1 2 3 4 5 |
>>> import json >>> print(json.dumps('中国')) "\u4e2d\u56fd" >>> print(json.dumps('中国', ensure_ascii=False)) "中国" |
有一段代码如下:
1 2 3 4 5 6 7 |
def save_data(self,data): print(data) #ensure_ascii=False data=json.dumps(data) print(data) with open('ljd.json',mode='w',encoding='utf-8') as f: f.write(data) |
date在传递进来之前是字典格式数据,现在为了能保存到文件中,因此用json.dumps(data)来将字典数据转换为json字符串,但是转换以后前后显示就有问题了,如下:
发现转换以后,中文乱码了。
原因:json.dumps 序列化时默认使用的ascii编码,想输出真正的中文需要指定ensure_ascii=False:更深入分析,是应为dJSON object 不是单纯的unicode实现,而是包含了混合的unicode编码以及已经用utf-8编码之后的字符串。
更改如下:
1 2 3 4 5 6 7 |
def save_data(self,data): print(data) #ensure_ascii=False data=json.dumps(data,ensure_ascii=False) print(data) with open('ljd.json',mode='w',encoding='utf-8') as f: f.write(data) |
而后,显示正常!