Java序列化原理详解

2022-11-13 11:11:52 原理序列化详解

前言

关于序列化的几种疑问？

什么是序列化？工作中什么时候用到序列化了？
为什么实现了java.io.Serializable接口就能序列化？
java中serialVersionUID 为什么不能改变？
Serializable序列化和JSON序列化有什么关系？
你都会哪几种对象深拷贝方式？

以上抛出了几个问题，大家都能回答上来吗？回答不上来的话就接着往下看吧。

前提知识：

讲解之前先扩充一些前提知识。

二进制协议和文本协议

首先我们要知道所有的数据在底层的传输都是二进制流，这点是毋庸置疑的。

那什么是文本协议？什么是二进制协议呢？

文本协议

文本协议一般是由一串ACSII字符组成的数据，这些字符包括数字，大小写字母、百分号，还有回车(\r)，换行(\n)以及空格等等。

文本协议设计的目的就是方便人们理解、读懂，所以，协议中通常会加入一些特殊字符用于分隔。

比如日常中发送请求时经常用到的方式： xml, json, fORMData，他们虽然格式不同，但都有一个特征，自带描述信息。

formData 31bytes

account=sqrtcat&passWord=123456

json 41bytes

{"account":"sqrtcat","password":"123456"}

xml 94bytes

<?xml version="1.0" encoding="UTF-8" ?> <account>sqrtcat</account> <password>123456</password>

但为了便于解析，文本协议不得不添加一些冗余的字符用于分隔命令，降低了其传输的效率；而且只适于传输文本，很难嵌入其他数据，比如一张图片。

二进制协议

二进制协议就是一串字节流，通常包括消息头(header)和消息体(body)，消息头的长度固定，并且消息头包括了消息体的长度。这样就能够从数据流中解析出一个完整的二进制数据。

二进制协议，没有冗余字段，传输高效，方便解析（固定长度，并且可以直接比较字节），缺点就是定义的比较死，哪个位置有哪些东西，是什么意义是定义死的，场景单一。

序列化

首先让百度来解释一下什么是序列化：

序列化是将对象的状态信息转换为可以存储或传输的形式的过程。在序列化期间，对象将其当前状态写入到临时或持久性存储区。之后，可以通过从存储区中读取或反序列化对象的状态，重新创建该对象。

那我们工作中什么时候用到序列化了？

在创建一个Java类时实现java.io.Serializable接口，将你的对象进行网络传输或者持久化；

使用spring注解@ResponseBody或者使用JSON框架(jackson、Gson、fastjson)等给前端返回json数据。

以上都涉及到了序列化。

为什么实现了java.io.Serializable接口就能序列化？

Java自己提供了一种序列化机制，这种机制能将一个对象序列化成二进制形式，用于写入磁盘或输出到网络，同时将从网络或者磁盘中读取的字节数组，反序列化成对象，在程序中使用。

便是实现java.io包下的Serializable接口，使用jdk 提供的两个输入、输出流对象 ObjectInputStream 和 ObjectOutputStream便可以对java对象进行序列化和反序列化。

java中serialVersionUID 不能改变的原因是避免反序列失败，可能会抛出序列化运行时异常。

Java序列化缺陷

实际工作中会发现我们自己很少会使用java提供的序列化，主要是因为JDK默认的序列化存在着一些非常严重的缺陷，比如它是无法实现跨平台和跨语言的，意思是我们在java中序列化的对象是无法被其他语言或者是被浏览器反序列的。

为了解决这一问题通常将Java对象转换为XML或Json格式进而实现网络传输。

JSON

看下定义：

JSON（javascript Object Notation, JS对象简谱）是一种轻量级的数据交换格式。它基于 ECMAScript（European Computer Manufacturers Association, 欧洲计算机协会制定的js规范）的一个子集，采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。易于人阅读和编写，同时也易于机器解析和生成，并有效地提升网络传输效率。它和xml一样都是一种数据交换格式。

我们在后端将需要返回的数据通过json处理成json字符串后转为二进制在网络中传输，浏览器会解析为json字符串，进而我们可以再通过json将json字符串转换为对象。

json 是⼀种很简洁的协议，但可惜的是，它只能传递基本的数型(int,long,string等)，但不能传递byte类型。如果想要传输图⽚等⼆进制⽂件的话，是没办法直接传输。

json序列化在webapi项目中非常流行。因为json非常的直观明了，调用者能够很直观的知道返回的数据信息。

二进制序列化一般情况下数据大小会比xml，json的序列化的更小。但是二进制则不能直观的知道数据的内容信息。

深拷贝

提供几种Java对象深拷贝方案：

//1.构造函数  《不推荐》
//2.implements Cloneable 重写clone()   《不推荐》
//3.序列化后反序列化	 《推荐》
// 使用Apache Commons Lang序列化进行深拷贝
User copyUser = (User) SerializationUtils.clone(user);

// 使用Gson序列化进行深拷贝
Gson gson = new Gson();
User copyUser = gson.fromJson(gson.toJson(user), User.class);

// 使用Jackson序列化进行深拷贝
ObjectMapper objectMapper = new ObjectMapper();
User copyUser = objectMapper.readValue(objectMapper.writeValueAsString(user), User.class);

上面我们可以通过json序列化的方式进行对象深拷贝，下面再提供一种使用二进制序列化的方式进行List<对象>深拷贝的实现方式：

    public static <T> List<T> copyList(List<T> source) {
        try {
            ByteArrayOutputStream byteOut = new ByteArrayOutputStream();
            ObjectOutputStream out = new ObjectOutputStream(byteOut);
            out.writeObject(source);

            ByteArrayInputStream byteIn = new ByteArrayInputStream(byteOut.toByteArray());
            ObjectInputStream inStream = new ObjectInputStream(byteIn);
            List<T> list = (List<T>) inStream.readObject();

            inStream.close();
            byteIn.close();
            out.close();
            byteOut.close();
            return list;
        } catch (Exception e) {
            log.info(e.getMessage(), e);
        }
        return null;
    }

到此这篇关于Java序列化原理详解的文章就介绍到这了,更多相关Java序列化内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

相关文章