张家港建网站的公司,花店网页设计首页图,定制建站 app建设,网站设计培训费用是多少第四章 TCP粘包/拆包问题
4.1 TCP 粘包/拆包
TCP是流协议#xff0c;也就是没有界限的的一串数据#xff0c;底层并不知道上层业务数据的具体含义#xff0c;也就是说一个完整的包可能会被拆分成多个包进行发送#xff0c;也可能把几个小包封装成一个大的数据包发送。这就…第四章 TCP粘包/拆包问题
4.1 TCP 粘包/拆包
TCP是流协议也就是没有界限的的一串数据底层并不知道上层业务数据的具体含义也就是说一个完整的包可能会被拆分成多个包进行发送也可能把几个小包封装成一个大的数据包发送。这就是拆包和粘包
4.1.1 TCP粘包拆包问题说明 存在4种情况 服务端分两次读取到了两个独立的数据包分别是D1和D2没有粘包和拆包; 服务端一次接收到了两个数据包D1和D2粘合在一起被称为TCP粘包: 服务端分两次读取到了两个数据包第一次读取到了完整的D1包和D2包的部分内容第二次读取到了D2包的剩余内容这被称为TCP拆包; 服务端分两次读取到了两个数据包第一次读取到了D1包的部分内容D11第二次读取到了D1包的剩余内容D12和D2包的整包。
如果此时服务端TCP接收滑窗非常小而数据包D1和D2比较大很有可能会发生第5种可能即服务端分多次才能将D1和D2包接收完全期间发生多次拆包。
4.1.2 原因
MTUMaximum Transmission Unit网络层能够传输的最大数据包大小以字节为单位 MTU限制了在网络上传输的每个数据包的最大大小。
MMSMaximum Segment SizeMMS是指TCP协议在一次传输中可以发送的最大数据量不包括TCP头部的大小。它是由MTU决定的具体来说是MTU减去IP和TCP头部的大小。MMS定义了TCP每次发送数据时数据段的最大大小。它保证了数据段能够顺利通过网络而不会导致分片。
TCP粘包和拆包发生的原因
应用程序write写入的字节大小大于套接口发送缓冲区大小进行MSS大小的 TCP分段;以太网帧的payload 大于MTU 进行IP 分片 4.1.3 粘包问题的解决
这个问题只能通过上层应用协议栈设计解决
消息定长包尾增加回车换行符进行分割例如FTP协议将消息分为消息头和消息体消息头包含消息总长度通常思路为消息头的第一个字段使用int32来表示消息总长度更复杂的应用层协议
4.2 TCP粘包导致的功能异常
会导致消息粘包程序不能正常运作
4.3 利用LineBasedFrameDecoder解决
在Handler之前添加两个解码器LineBasedFrameDecoder和StringDecoder
原理分析
LineBasedFrameDecoder的工作原理是它依次遍历ByteBuf中的可读字节判断看是否有“\”或者“\r\n”如果有就以此位置为结束位置从可读索引到结束位置区间的字节就组成了一行。它是以换行符为结束标志的解码器支持携带结束符或者不携带结束符两种解码方式同时支持配置单行的最大长度。如果连续读取到最大长度后仍然没有发现换行符就会抛出异常同时忽略掉之前读到的异常码流。
StringDecoder的功能就是将接收到的对象转换成字符串然后继续调用后面的 Handler。LineBasedFrameDecoderStringDecoder 组合就是按行切换的文本解码器它被设计用来支持TCP的粘包和拆包。
Netty提供多种解码器
第五章 分隔符和定长解码器的应用
四种区分消息的方式
消息定长累计读取到长度总和为LEN的报文后就认为读到了一个完整的消息将计数器重置读取下一个包尾增加回车换行符进行分割例如FTP协议特殊分隔符作为消息的结束标志比如回车换行符将消息分为消息头和消息体消息头包含消息总长度通常思路为消息头的第一个字段使用int32来表示消息总长度
Netty对这四种应用做了统一的抽象提供了四种编码解码器
5.1 DelimiterBasedFrameDecoder
自动完成以分隔符做结束的消息的解码
5.1.1 服务端开发
创建一个DelimiterBasedFrameDecoder对象加入到ChannelPipeline有两个参数一个是单挑消息的最大长度一个是分隔符缓冲对象
然后将StringDecoder加入Pipeline将ByteBuf解码成字符串对象再由ServerHandler处理业务
5.1.2 客户端开发
与服务端添加方法类似
5.2 FixedLengthFrameDecoder
固定长度解码器能够按照指定长度对消息自动解码
5.2.1 服务端开发
在服务端的ChannelPipeline中新增FixedLengthFrameDecoder长度设置为20在依次添加字符串解码器和ServerHandler
利用 FixedLengthFrameDecoder 解码器无论一次接收到多少数据报它都会按照构造函数中设置的固定长度进行解码如果是半包消息FixedLengthFrameDecoder 会缓存半包消息并等待下个包到达后进行拼包直到读取到一个完整的包。
第六章 编解码技术
进行远程传输时将被传输的Java对象编码成字节数组或者ByteBuffer对象远程服务读取到ByteBuffer对象或字节数组时需要解码为发送时的Java对象。称为编解码技术
6.1 Java序列化的缺点
评判一个编解码框架的优劣时往往会考虑以下几个因素。
是否支持跨语言支持的语言种类是否丰富:编码后的码流大小:编解码的性能;类库是否小巧API使用是否方便;使用者需要手工开发的工作量和难度。
几乎所有的Java RPC框架都没有使用Java序列化作为编解码框架有以下缺点 无法跨语言 序列化后的码流太大 序列化性能太低
6.2 主流的编解码框架
Netty中应用的一些编解码框架
6.2.1 Google的Protobuf
数据结构以.proto 文件进行描述通过代码生成工具可以生成对应数据结构的POJO对象和Protobuf相关的方法和属性
特点
结构化数据存储格式高效的编解码性能语言无关、平台无关、扩展性好官方支持Java、C和python
优点
文本化的数据结构描述语言可以实现语言和平台无关特别适合异构系统间的集成;通过标识字段的顺序可以实现协议的前向兼容:自动代码生成不需要手工编写同样数据结构的C和Java版本:方便后续的管理和维护。相比于代码结构化的文档更容易管理和维护。
6.2.2 Facebook的Thrift
支持数据序列化和多种类型的RPC服务适用于静态的数据交换需要先确定好数据结构数据结构发生变化时必须重新编辑IDL文件。支持二进制压缩编解码所以性能表现也很优异
由五部分组成 语言系统以及IDL编译器:负责由用户给定的IDL文件生成相应语言的接口代码; TProtocol:RPC的协议层可以选择多种不同的对象序列化方式如JSON和Binary; TTransport:RPC的传输层同样可以选择不同的传输层实现如socket、NIO、MemoryBuffer等: TProcessor:作为协议层和用户提供的服务实现之间的纽带负责调用服务实现的接口; TServer:聚合TProtocol、TTransport和 TProcessor 等对象
编解码框架与之对应的就是TProtocol。由于Thri的RPC服务调用和编解码框架绑定在一起,所以,通常我们使用Thrit的时候会采取RPC框架的方式。但是它的TProtocol编解码框架还是可以以类库的方式独立使用的。
6.2.3 JBoss Marshalling
是一个Java对象的序列化API包修正了JDK自带的序列化包的一些问题
优点
可插拔的类解析器提供更加便捷的类加载定制策略通 过口即可实现定制;可插拔的对象替换技术不需要通过继承的方式;可插拔的预定义类缓存表可以减小序列化的字节数组长度提升常用类型的对象序列化性能;无须实现 java.io.Serializable接口即可实现 Java序列化;通过缓存技术提升对象的序列化性能。