:2026-04-06 18:24 点击:1
在以太坊的世界里,数据序列化是区块链节点间通信、状态存储和交易处理的核心环节,而 RLP(Recursive Length Prefix,递归长度前缀)正是以太坊中用于序列化数据结构的主要编码方式,无论是账户状态、交易数据还是区块信息,其底层都离不开 RLP 的身影,本教程将带你从零开始,深入理解 RLP 的原理,并通过实例掌握其编码与解码方法。
RLP 是一种针对以太坊中任意嵌套字节数组和字节数组的序列化方法,它的设计目标是简洁、高效,并且能够处理嵌套结构。
为什么需要 RLP?

RLP 的核心思想是:对于单个字节数组,如果它的长度在某个阈值内,则直接编码;否则,在其前面加上一个前缀表示其长度,对于嵌套的数据结构(列表),则将其所有元素依次 RLP 编码后拼接起来,然后在整个拼接结果前加上一个前缀表示总长度。
RLP 的编码对象有两种基本类型:字符串(字节数组)和列表。
字符串是指一串字节数据("以太坊" 的 UTF-8 编码,或者一个十六进制数的字节表示)。
编码规则如下:
如果字符串长度为 0 (空字符串):
编码结果为单字节 0x80 (二进制 10000000)。
RLP("") = 0x80如果字符串长度为 1,且字节值小于 0x80 (即最高位为 0):
编码结果就是该字节本身,这称为“短字符串”优化。
RLP("d") ("d" 的 ASCII 码是 0x64) = 0x64如果字符串长度为 1,且字节值大于等于 0x80 (即最高位为 1):
编码结果为前缀 0x37 (十进制 55) 加上该字节。
RLP("\x80") (一个字节,值为 0x80) = 0x3780如果字符串长度大于 1:
0x38):
编码结果为单字节前缀 0x80 + L 加上字符串本身。RLP("dog") (长度为 3) = 0x83 + "dog" = 0x646f67 (注意:"dog" 的 ASCII 码分别是 0x64, 0x6f, 0x67)0xb7 + len(B) 加上 B,再加上字符串本身。RLP("abcdefghijklmnopqrstuvwxyz") (长度为 26,小于 56,所以是 0x80 + 26 = 0x9a + 字符串) = 0x9a6162636465666768696a6b6c6d6e6f707172737475767778797a0x38),则 B 为 0x38,len(B)=1,编码结果为 0xb7 + 1 = 0xb8 + 0x38 + 字符串 = 0xb838 + 字符串。0x400),B 为 0x0400 (2字节),len(B)=2,编码结果为 0xb7 + 2 = 0xb9 + 0x0400 + 字符串 = 0xb90400 + 字符串。列表是零个或多个 RLP 编码后的字符串或列表的集合。
编码规则如下:
如果列表为空(没有元素):
编码结果为单字节 0xc0 (二进制 11000000)。
RLP([]) = 0xc0如果列表不为空:
0x38):
编码结果为单字节前缀 0xc0 + L 加上 S。RLP(["dog", "cat"])0x646f670x6361740x646f67636174 (长度 6)0xc0 + 6 = 0xc6 + S = 0xc6646f676361740xf7 + len(B) 加上 B,再加上 S。RLP(["hello", "world", "!"]) (假设每个元素的 RLP 编码拼接后 S 的长度为 60)0x3c (60 的单字节表示)0xf7 + 1 = 0xf8 + 0x3c + S = 0xf83c + S解码是编码的逆过程,相对复杂一些,需要递归处理。
0x80:这是一个短字符串,编码结果就是该字节本身。
0x80:这是一个空字符串。
0x80 < 前缀字节 <= 0xb7:0x80。0xb7 < 前缀字节 <= 0xbf:0xb7。0xc0:这是一个空列表。
0xc0 < 前缀字节 <= 0xf7:0xc0。0xf7:这是一个列表,列表总字节数的长度字节数 = 前缀字节 - `0xf7
本文由用户投稿上传,若侵权请提供版权资料并联系删除!