在Python中解决中英文混杂出错的问题
创始人
2024-03-23 13:40:12
0

前两天用Python写了个小脚本,其中有个需求是从一个文本文件A中读取数据,然后处理一下写进一个新的文本文件B中。不过A文件中既有英文也有中文。
写出处理这个需求的代码并不复杂,随手就能写下类似的代码:

1def write_a_line(line, fp):
2    fp.write(line)

不过这段程序一旦碰到有汉字的字符串时,可能就会遇到下面的问题:

Traceback (most recent call last):

 File "", line 1, in

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1:

ordinal not in range(128)

恩,这种情况对于我们平时使用C#或者Java的程序员来说确实比较头大。从这个错误提示来看,Python在写文件时,对line变量进行了编码操作,而且是针对line对象进行ASCII码的编码。

我们都知道Python是支持unicode的,而且还有针对unicode的类型“unicode”。要想让字符串称为unicode字符串,可以在字符串的引号前面加入一个小写字母“u”。翻阅Python的文档,我们可以发下write方法接收的是str对象。不过Python并不像C#,它不用声明变量的类型。所以我们应该先看看line到底是个什么对象。于是为了解决这个问题,我把上面的代码加了一行:

1def write_a_line(line, fp):
2    print line.__class__.__name__
3    fp.write(line)

代码运行之后,我发现当line中有中文的时候,我们的line变量的类型是unicode。从网上搜了一下与unicode与写文件相关的帖子,可以得到一个信息,对这unicode对象调encode方法进行编码就可以正常写文件了。于是代码又编程了下面的样子:

1def write_a_line(line, fp):
2    if line.__class__.__name__ == “unicode”:
3        line = line.encode(“GB2312”)
4    fp.write(line)

这里要注意的问题是不能一棍子打死,line可能会是unicode对象也可能是str对象,不过我们只对unicode对象进行编码。这下问题总算是解决了。

【编辑推荐】

  1. Python异常处理体系简介
  2. 使用Oracle数据库实现Python数据持久
  3. 学习使用 Python 编写插件

相关内容

热门资讯

PHP新手之PHP入门 PHP是一种易于学习和使用的服务器端脚本语言。只需要很少的编程知识你就能使用PHP建立一个真正交互的...
网络中立的未来 网络中立性是什... 《牛津词典》中对“网络中立”的解释是“电信运营商应秉持的一种原则,即不考虑来源地提供所有内容和应用的...
各种千兆交换机的数据接口类型详... 千兆交换机有很多值得学习的地方,这里我们主要介绍各种千兆交换机的数据接口类型,作为局域网的主要连接设...
什么是大数据安全 什么是大数据... 在《为什么需要大数据安全分析》一文中,我们已经阐述了一个重要观点,即:安全要素信息呈现出大数据的特征...
如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
P2P的自白|我不生产内容,我... 现在一提起P2P,人们就会联想到正在被有关部门“围剿”的互联网理财服务。×租宝事件使得劳...
Intel将Moblin社区控... 本周二,非营利机构Linux基金会宣布,他们将担负起Moblin社区的管理工作,而这之前,Mobli...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...