• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

Java FileInputStream读中文乱码问题解决方案

java 搞代码 4年前 (2022-01-09) 21次浏览 已收录 0个评论

1、前提

以读取编码是GBK的文件为案例,文件内容只有中文和中文符号

2、原因

FileInputStream读中文乱码是因为一个中文对应两个字节存储(负数),也就是说,读取对应中文的字节数应该是偶数; 而英文对应一个字节存储。FileInputStream每次读取一个数组长度的字节时,读取的中文字节数可能是奇数,也就是只读到中文的一半字节,出现乱码。

3、解本文来源gao.dai.ma.com搞@代*码(网$决方法

一次读取所有字节,此方法不靠谱,因为不确定总字节数。

在输出时进行判断,遍历数组判断负数的个数,如果是奇数,说明读取到中文的一半字节,对数组进行扩容再输出;否则正常输出

4、代码案例

package 第二题;
​
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.UnsupportedEncodingException;
import java.util.Arrays;
​
public class MainTest {
​
  public static void main(String[] args) throws UnsupportedEncodingException {
    // 创建File对象
    File file = new File("D:\\filetest\\file4.txt");
    FileInputStream fileInputStream = null;
    try {
      // 新建一个FileInputStream对象
      fileInputStream = new FileInputStream(file);
      // 新建一个字节数组
      byte[] buf = new byte[2];
      // read(buf):此方法的返回值就是当前读取的字节个数,将数据读取到buf数组
      // 将readLen变量也就是read方法的返回值,当此变量等于-1,则读到文件末尾
      int readLen = -1;
       //读取文件数据
      while ((readLen = fileInputStream.read(buf)) != -1) {  
        int pos=0;//记录负数的个数
        for(byte v:buf)
        {
          if(v<0)
          {
            pos++; 
          }
        }
        //负数个数为偶数,读取完整,没有读取到半个中文
        if(pos%2==0)
        {
          // 将字节数组转换成字符串
          String content = new String(buf, 0, readLen);
          System.out.print(content);
        }else {//负数个数为奇数,读取不完整,会乱码
         //再读取下一位字节
          int nextByteValue=fileInputStream.read();
          int nextLen=readLen+1;
          //字节数组扩容一位
          buf= Arrays.copyOf(buf,nextLen);
          buf[readLen]= (byte) nextByteValue;
          String content=new String(buf,0,nextLen);
          System.out.print(content);
          //奇数,字节补全
          //针对数组扩容一个字节单元
        /* buf=Arrays.copyOf(buf, readLen+1);
          int nextByteValue=fileInputStream.read();
          buf[readLen]= (byte) nextByteValue;
          String content = new String(buf, 0, readLen);
          System.out.print(content);*/
        }            
      }
    } catch (FileNotFoundException e) {
      // 输出堆栈信息
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    } finally {
      try {
        // 文件输入流关闭(释放资源)
        fileInputStream.close();
      } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
      }
    }
  }
}

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持搞代码


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:Java FileInputStream读中文乱码问题解决方案
喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址