首页 > 编程 > Java > 正文

Java避免UTF-8的csv文件打开中文出现乱码的方法

2019-11-26 08:47:50
字体:
来源:转载
供稿:网友

本文实例讲述了Java避免UTF-8的csv文件打开中文出现乱码的方法。分享给大家供大家参考,具体如下:

最近又遇到了需要提供csv下载功能的需求,不同的时需要用java来实现,心想简单,就把以前php的版本重写了一遍,然后生成一份csv,用excel2007打开一看,里面的中文都是乱码,一下就懵了,以前好好的功能怎么突然不行了??以前也一直用2007的啊!于是开始了漫长的google之旅。

看来看去,说的都是输出utf-8格式的csv需要在文件头先输出BOM(BOM不懂的可以google了),即0xEF 0xBB 0xBF三个字节,这样更摸不着头脑了,明明是对的,偏偏不成功,直到发现一个帖子:http://stackoverflow.com/a/9337150/1794493 ,里面提到2007需要装sp3才能识别BOM,shit!原来是这回事!里面同时又提到,用utf-16le编码输出貌似更通用,经测试确实如此,但是utf-16le的BOM是0xFF 0xFE,帖子里面说错了!下面是一个简单的测试结果:

excel版本 附加包 编码  测试结果
2007 sp3 utf-8 yes
2007 utf-8 no
2007 sp3 utf-16le yes
2007 utf-16le yes
2011 utf-8 no
2011 utf-16le yes

因为条件有限,只测试了这几个版本,可见utf-16le是更通用的编码格式。下面附上java代码,main方法中采用utf-16le编码,最后调用了utf8编码的方法,最后会输出两种编码格式的csv文件:

import java.io.*;/** * Created by zhaozhi on 15-5-29. */public class TestCSV {  public static String join(String[] strArr, String delim) {    StringBuilder sb = new StringBuilder();    for(String s : strArr) {      sb.append(s);      sb.append(delim);    }    String ret;    if (strArr.length > 1) {      ret = sb.substring(0, sb.length()-1);    }    else {      ret = sb.toString();    }    return ret;  }  public static void main (String[] args) throws Exception {    String[] heads = {"日期", "产品", "订单数"};    String[][] rows = {        {"20150228", "安卓", "23"},        {"20150301", "web", "34"}    };    byte[] bom = {(byte)0xFF, (byte)0xFE};    String fname = "d://utf-16le.csv";    BufferedOutputStream bo = new BufferedOutputStream(new FileOutputStream(fname));    bo.write(bom);    bo.write(join(heads, "/t").getBytes("utf-16le"));    bo.write("/n".getBytes("utf-16le"));    for (String[] row : rows) {      bo.write(join(row, "/t").getBytes("utf-16le"));      bo.write("/n".getBytes("utf-16le"));    }    bo.close();    UTF8();  }  public static void UTF8() throws IOException {    String line = "中文,标题,23";    OutputStream os = new FileOutputStream("d:/utf-8.csv");    os.write(239);  // 0xEF    os.write(187);  // 0xBB    os.write(191);  // 0xBF    PrintWriter w = new PrintWriter(new OutputStreamWriter(os, "UTF-8"));    w.print(line);    w.flush();    w.close();  }}

更多关于java相关内容感兴趣的读者可查看本站专题:《Java编码操作技巧总结》、《Java数学运算技巧总结》、《Java数据结构与算法教程》、《Java字符与字符串操作技巧总结》、《Java操作DOM节点技巧总结》和《Java缓存操作技巧汇总

希望本文所述对大家java程序设计有所帮助。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表