Solidity编译器漏洞分析：ABI重编码的缺陷

odaily 2023年04月25日 18:26

ABI?编码格式是用在用户或合约对合约进行函数调用，传递参数时的标准编码方式。具体可以参考?Solidity?官方关于ABI?编码的详细表述。

在合约开发过程中，会从用户或其他合约传来的?calldata?数据中，获取需要的数据，之后可能会将获取的数据进行转发或?emit?等操作。限于?evm?虚拟机的所有?opcode?操作都是基于?memory、stack?和?storage，所以在?Solidity?中，涉及到需要对数据进行?ABI?编码的操作，都会将?calldata?中的数据根据新的顺序按照?ABI?格式进行编码，并存储到?memory?中。

该过程本身并没有大的逻辑问题，但是当和?Solidity?的cleanup?机制结合时，由于?Solidity?编译器代码本身的疏漏，就导致了漏洞的存在。

根据?ABI?编码规则，在去掉函数选择符之后，ABI?编码的数据分为?head?和?tail?两部分。当数据格式为固定长度的?uint?或?bytes?32?数组时，ABI?会将该类型的数据都存储在?head?部分。而?Solidity?对?memory?中?cleanup?机制的实现是在当前索引的内存被使用后，将下一个索引的内存置空，以防止下一索引的内存使用时被脏数据影响。并且，当?Solidity?对一组参数数据进行?ABI?编码时，是按照从左到右的顺序进行编码！！

为了便于后面的漏洞原理探索，考虑如下形式的合约代码：

contract Eocene {
event VerifyABI( bytes[],?uint[?2?]);
function verifyABI(bytes[] calldata a, uint[?2?] calldata b) public ?{
emit VerifyABI(a, b); ? //Event 数据会按照?ABI?格式编码之后存储到链上
? ? }
}

合约?Eocene?中?verifyABI?函数的作用，仅仅是将函数参数中的不定长?bytes[] a?和定长?uint[2?] b?进行?emit。

这里需要注意，event?事件也会触发?ABI?编码。这里参数?a,?b?会编码成?ABI?格式后再存储到链上。

我们使用?v?0.8.14?版本的?Solidity?对合约代码进行编译，通过?remix?进行部署，并传入verifyABI(['0x?aaaaaa','0x?bbbbbb'],[0x?11111,?0x?22222?])。

首先，我们看一看对verifyABI(['0x?aaaaaa','0x?bbbbbb'],[0x?11111,?0x?22222?])的正确编码格式：

0x?5?2c?d?1?a?9?c ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?// bytes?4(sha?3("verify(btyes[],?uint[?2?])"))
0000000000000000000000000000000000000000000000000000000000000060 ? ? ? ? ? ?// index of ?a
0000000000000000000000000000000000000000000000000000000000011111 ? ? ? ? ? ?// b[0?]
0000000000000000000000000000000000000000000000000000000000022222 ? ? ? ? ? ?// b[1?]
0000000000000000000000000000000000000000000000000000000000000002 ? ? ? ? ? ?// length of a
0000000000000000000000000000000000000000000000000000000000000040 ? ? ? ? ? ?// index of a[0?]
0000000000000000000000000000000000000000000000000000000000000080 ? ? ? ? ? ?// index of a[1?]
0000000000000000000000000000000000000000000000000000000000000003 ? ? ? ? ? ?// length of a[0?]
aaaaaa?0000000000000000000000000000000000000000000000000000000000 ? ? ? ? ? ?// a[0?]
0000000000000000000000000000000000000000000000000000000000000003 ? ? ? ? ? ?// length of a[1?]
bbbbbb?0000000000000000000000000000000000000000000000000000000000 ? ? ? ? ? ?// a[1?]

如果?Solidity?编译器正常，当参数a,?b被?event?事件记录到链上时，数据格式应该和我们发送的一样。让我们实际调用合约试试看，并对链上的?log?进行查看,如果想自己对比，可以查看该TX。

成功调用后，合约?event?事件记录如下：

！！震惊，紧跟?b[1?]的，存储?a?参数长度的值被错误的删除了！！

0000000000000000000000000000000000000000000000000000000000000060 ? ? ? ? ? ?// index of ?a
0000000000000000000000000000000000000000000000000000000000011111 ? ? ? ? ? ?// b[0?]
0000000000000000000000000000000000000000000000000000000000022222 ? ? ? ? ? ?// b[1?]
0000000000000000000000000000000000000000000000000000000000000000 ? ? ? ? ? ?// length of a?why become 0
0000000000000000000000000000000000000000000000000000000000000040 ? ? ? ? ? ?// index of a[0?]
0000000000000000000000000000000000000000000000000000000000000080 ? ? ? ? ? ?// index of a[1?]
0000000000000000000000000000000000000000000000000000000000000003 ? ? ? ? ? ?// length of a[0?]
aaaaaa?0000000000000000000000000000000000000000000000000000000000 ? ? ? ? ? ?// a[0?]
0000000000000000000000000000000000000000000000000000000000000003 ? ? ? ? ? ?// length of a[1?]
bbbbbb?0000000000000000000000000000000000000000000000000000000000 ? ? ? ? ? ?// a[1?]

为什么会这样？

正如我们前面所说，在?Solidity?遇到需要进行?ABI?编码的系列参数时，参数的生成顺序是从左至，具体对?a,?b?的编码逻辑如下

在源代码层面，具体的错误逻辑也很明显，当需要从?calldata?获取定长?bytes?32?或?uint?数组数据到?memory?中时，Solidity?总是会在数据复制完毕后，将后一个内存索引数据置为?0?。又由于?ABI?编码存在?head?和?tail?两部分，且编码顺序也是从左至右，就导致了漏洞的存在。

具体漏洞的?Solidity?编译代码如下：

当源数据存储位置为?Calldata，且源数据类型为?ByteArray，String，或者源数组基础类型为?uint?或?bytes?32?时进入ABIFunctions::abiEncodingFunctionCalldataArrayWithoutCleanup()

Solidity编译器漏洞分析：ABI重编码的缺陷

进入之后，会首先通过fromArrayType.isDynamicallySized()对源数据是否为定长数组来对源数据进行判断，只有定长数组才符合漏洞触发条件。

将isByteArrayOrString()判断结果传递给YulUtilFunctions::copyToMemoryFunction(), 根据判断结果来确定是否在?calldatacopy?操作完成后，对后一个索引位置进行?cleanup。

上诉几个约束条件结合，就只有位于?calldata?中的源数据格式为定长的?uint?或?bytes?32?的数组复制到内存时才能触发漏洞。也即是漏洞触发的约束条件产生的原因。

Solidity编译器漏洞分析：ABI重编码的缺陷

由于?ABI?进行参数编码时，总是从左到右的顺序，考虑到漏洞的利用条件，我们必须要明白，必须在定长的?uint?和?bytes?32?数组前，存在动态长度类型的数据被存储到?ABI?编码格式的?tail?部分，且定长的?uint?或?bytes?32?数组必须位于待编码参数的最后一个位置。

原因很明显，如果定长的数据没有位于最后一个待编码参数位置，那么对后一内存位置的置?0?不会有任何影响，因为下个编码参数会覆盖该位置。如果定长数据前面没有数据需要被存储到?tail?部分，那么即便后一内存位置被置?0?也没有关系，因为该位置并不背?ABI?编码使用。

另外，需要注意的是，所有的隐式或显示的?ABI?操作，以及符合格式的所有?Tuple（一组数据），都会受到该漏洞的影响。

具体的涉及到的操作如下：

当合约代码中存在上诉受影响的操作时，保证最后一个参数不为定长的?uint?或?bytes?32?数组

使用不受漏洞影响的?Solidity?编译器

寻求专业的安全人员的帮助，对合约进行专业的安全审计

Learn more: Website?| Medium?| Twitter

Solidity编译器漏洞分析：ABI重编码的缺陷

相关资讯