浅谈Java读取Csv实践
创始人
2024-07-25 01:51:38
0

Csv文件,逗号分隔的常用数据文件格式,默认可以用Office软件打开。

维基百科对CSV的详细描述:

http://zh.wikipedia.org/wiki/CSV

看项目中以前的处理方式是直接用用java IO类库读取Csv文件,实际处理中发现Csv文件本身包含了对各种特殊字符的处理信息。最常见的比如:

1. 对包含特殊字符的字符串数据首尾加双引号

2. 对数据中的单个双引号前加单个双引号

其它...

所以用Java IO读到的字符串全是经过处理后的字符串,在某些场景下是不符合预期需求的。比如我需要的是不做任何处理的原始内容。

项目中另一种常见的文件格式Excel用了POI来处理,但是POI不支持Csv格式,于是找到了javacsv。

代码很简单:

Java代码

  1. public List importCsv(String file) {     
  2.         List list = new ArrayList();     
  3.         CsvReader reader = null;     
  4.         try {     
  5.             //初始化CsvReader并指定列分隔符和字符编码     
  6.             reader = new CsvReader(file, ',', Charset.forName("GBK"));     
  7.             while (reader.readRecord()) {     
  8.                 //读取每行数据以数组形式返回     
  9.                 String[] str = reader.getValues();       
  10.                 if (str != null && str.length > 0) {     
  11.                     if (str[0] != null && !"".equals(str[0].trim())) {     
  12.                         list.add(str);     
  13.                     }     
  14.                 }     
  15.             }     
  16.         } catch (FileNotFoundException e) {     
  17.             log.error("Error reading csv file.",e);     
  18.         } catch (IOException e) {     
  19.             log.error("",e);     
  20.         }     
  21.         finally{     
  22.             if(reader != null)     
  23.                 //关闭CsvReader     
  24.                 reader.close();     
  25.         }     
  26.         return list;     
  27.     }   

 

以上代码有几个要点:

1 初始化CsvReader时指定分隔符和字符编码,如果不指定,默认分别为逗号和ISO-8859-1,我用了GBK,具体使用时要看当时的字符编码而定。

2 读取每行数据,返回字符串数组,数组内的顺序即文件数据列的顺序

3 ***记得关闭CsvReader

是不是很简单,返回的数组格式也正好是我想要的,而且拿到是原始的数据,没有经过特殊字符处理。

有些童鞋质疑特殊字符未经处理,插到数据库会出错,其实大可不必我们手工处理,一些基础组件比如JDBC的preparedstatement已经包含了对特殊字符的处理,我们只要以绑定参数的形式来传送这些包含特殊字符的数据就可以。常用的持久化框架底层也封装了JDBC,自然也对特殊字符做了处理。

附javacvs2.0.zip链接:http://shaka.iteye.com/blog/983282

【编辑推荐】

  1. Java 7路线图更新 未包含闭包特性
  2. Java 7.0中值得期待的新功能预览
  3. Java程序开发中的简单内存分析
  4. 2009年十大Java技术解决方案
  5. 2008最值得学习的五种JAVA技术

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...
《非诚勿扰》红人闫凤娇被曝厕所... 【51CTO.com 综合消息360安全专家提醒说,“闫凤娇”、“非诚勿扰”已经被黑客盯上成为了“木...