探索Lua5.2内部实现:虚拟机指令(4) Table

 

探索Lua5.2内部实现:虚拟机指令(4) Table

name args desc
OP_NEWTABLE A B C R(A) := {} (size = B,C)

NEWTABLE在寄存器A处创建一个table对象。B和C分别用来存储这个table数组部分和hash部分的初始大小。初始大小是在编译期计算出来并生成到这个指令中的,目的是使接下来对table的初始化填充不会造成rehash而影响效率。B和C使用“floating point byte”的方法来表示成(eeeeexxx)的二进制形式,其实际值为(1xxx) * 2^(eeeee-1)。

local a = {};  

  1   [1] NEWTABLE    0 0 0  
  2   [1] RETURN      0 1   

上面代码生成一个空的table,放入local变量a,B和C参数都为0。

name args desc
OP_SETLIST A B C R(A)[(C-1)*FPF+i] := R(A+i), 1 <= i <= B

SETLIST用来配合NEWTABLE,初始化表的数组部分使用的。A为保存待设置表的寄存器,SETLIST要将A下面紧接着的寄存器列表(1--B)中的值逐个设置给表的数组部分。

当表需要初始化数组元素数量比较小的情况下,例如:

local a = {1,1,1};  

      1   [1] NEWTABLE    0 3 0  
      2   [1] LOADK       1 -1    ; 1  
      3   [1] LOADK       2 -1    ; 1  
      4   [1] LOADK       3 -1    ; 1  
      5   [1] SETLIST     0 3 1   ; 1  
      6   [1] RETURN      0 1  
  constants (1) for 0x80048eb0:  
      1   1   

第1行先用NEWTABLE构建一个具有3个数组元素的表,让到寄存器0中;然后使用3个LOADK向下面3个寄存器装入常量1;最后使用SETLIST设置表的1~3为寄存器1~寄存器3。

如果需要创建一个很大的表,其中包含很多的数组元素,使用如上方法就会遇到一个问题。将这些指按顺序放到寄存器时,会超出寄存器的范围。解决的办法就是按照一个固定大小,将这些数组元素分批进行设置。在Lua中,每批的数量由lopcodes.h中的LFIELDS_PER_FLUSH定义,数量为50。所以,大数量的设置会按照50个一批,先将值设置到表下面的寄存器,然后设置给对应的表项。C代表的就是这一次调用SETLIST设置的是第几批。回到上面的例子,因为只有3个表项,所以1批就搞定了,C的值为1。

下面是一个大表的设置:

  local a =   
  {  
      1,2,3,4,5,6,7,8,9,0,  
      1,2,3,4,5,6,7,8,9,0,  
      1,2,3,4,5,6,7,8,9,0,  
      1,2,3,4,5,6,7,8,9,0,  
      1,2,3,4,5,6,7,8,9,0,  
      1,2,3  
 };  
      1   [1] NEWTABLE    0 30 0  
      2   [3] LOADK       1 -1    ; 1  
      3   [3] LOADK       2 -2    ; 2   
  ...  
      50  [7] LOADK       49 -9   ; 9  
      51  [7] LOADK       50 -10  ; 0  
      52  [7] SETLIST     0 50 1  ; 1  
      53  [8] LOADK       1 -1    ; 1  
      54  [8] LOADK       2 -2    ; 2  
      55  [9] LOADK       3 -3    ; 3  
      56  [9] SETLIST     0 3 2   ; 2  
      57  [9] RETURN      0 1  
  constants (10) for 0x80048eb0:  
      1   1  
      2   2  
      3   3  
      4   4  
      5   5  
      6   6  
      7   7  
      8   8  
      9   9  
      10  0   

可以看到,这个表的初始化使用了两个SETLIST指令。第一个处理前50个,C为1,设置id从(C-1)50 + 1开始,也就是1。第二个处理余下的3个,C为2,设置的id从(C-1)50 + 1开始,也就是51。

如果数据非常大,导致需要的批次超出了C的表示范围,那么C会被设置成0,然后在SETLIST指令后面生成一个EXTRAARG指令,并用其Ax来存储批次。这与前面说到的LOADKX的处理方法一样,都是为处理超大数据服务的。

如果使用核能产生多个返回值的表达式(... 和 函数调用)初始化数组项,如果这个初始化不是表构造的最后一项,那么只有第一个返回值会被设置到数组项;如果是最后一项,那么SETLIST中的B会被设置为0,表示从A+1到当前栈顶都用来设置。

SETLIST只负责初始化表的数组部分,对于hash部分,还是通过SETTABLE来初始化。

name args desc
OP_GETTABLE A B C R(A) := R(B)[RK(C)]
OP_SETTABLE A B C R(A)[RK(B)] := RK(C)

GETTABLE使用C表示的key,将寄存器B中的表项值获取到寄存器A中。SETTABLE设置寄存器A的表的B项为C代表的值。

  local a = {};  
  a.x = 1;  
  local b = a.x;  
  1   [1] NEWTABLE    0 0 0  
  2   [2] SETTABLE    0 -1 -2 ; "x" 1  
  3   [3] GETTABLE    1 0 -1  ; "x"  

文章导航