探索Lua5.2内部实现:虚拟机指令(4) Table

name	args	desc
OP_NEWTABLE	A B C	R(A) := {} (size = B,C)

NEWTABLE在寄存器A处创建一个table对象。B和C分别用来存储这个table数组部分和hash部分的初始大小。初始大小是在编译期计算出来并生成到这个指令中的，目的是使接下来对table的初始化填充不会造成rehash而影响效率。B和C使用“floating point byte”的方法来表示成(eeeeexxx)的二进制形式，其实际值为(1xxx) * 2^(eeeee-1)。

local a = {};

  1   [1] NEWTABLE    0 0 0  
  2   [1] RETURN      0 1

上面代码生成一个空的table，放入local变量a，B和C参数都为0。

name	args	desc
OP_SETLIST	A B C	R(A)[(C-1)*FPF+i] := R(A+i), 1 <= i <= B

SETLIST用来配合NEWTABLE，初始化表的数组部分使用的。A为保存待设置表的寄存器，SETLIST要将A下面紧接着的寄存器列表(1--B)中的值逐个设置给表的数组部分。

当表需要初始化数组元素数量比较小的情况下，例如:

local a = {1,1,1};

      1   [1] NEWTABLE    0 3 0  
      2   [1] LOADK       1 -1    ; 1  
      3   [1] LOADK       2 -1    ; 1  
      4   [1] LOADK       3 -1    ; 1  
      5   [1] SETLIST     0 3 1   ; 1  
      6   [1] RETURN      0 1  
  constants (1) for 0x80048eb0:  
      1   1

第1行先用NEWTABLE构建一个具有3个数组元素的表，让到寄存器0中；然后使用3个LOADK向下面3个寄存器装入常量1；最后使用SETLIST设置表的1~3为寄存器1~寄存器3。

如果需要创建一个很大的表，其中包含很多的数组元素，使用如上方法就会遇到一个问题。将这些指按顺序放到寄存器时，会超出寄存器的范围。解决的办法就是按照一个固定大小，将这些数组元素分批进行设置。在Lua中，每批的数量由lopcodes.h中的LFIELDS_PER_FLUSH定义，数量为50。所以，大数量的设置会按照50个一批，先将值设置到表下面的寄存器，然后设置给对应的表项。C代表的就是这一次调用SETLIST设置的是第几批。回到上面的例子，因为只有3个表项，所以1批就搞定了，C的值为1。

下面是一个大表的设置：

  local a =   
  {  
      1,2,3,4,5,6,7,8,9,0,  
      1,2,3,4,5,6,7,8,9,0,  
      1,2,3,4,5,6,7,8,9,0,  
      1,2,3,4,5,6,7,8,9,0,  
      1,2,3,4,5,6,7,8,9,0,  
      1,2,3  
 };

      1   [1] NEWTABLE    0 30 0  
      2   [3] LOADK       1 -1    ; 1  
      3   [3] LOADK       2 -2    ; 2   
  ...  
      50  [7] LOADK       49 -9   ; 9  
      51  [7] LOADK       50 -10  ; 0  
      52  [7] SETLIST     0 50 1  ; 1  
      53  [8] LOADK       1 -1    ; 1  
      54  [8] LOADK       2 -2    ; 2  
      55  [9] LOADK       3 -3    ; 3  
      56  [9] SETLIST     0 3 2   ; 2  
      57  [9] RETURN      0 1  
  constants (10) for 0x80048eb0:  
      1   1  
      2   2  
      3   3  
      4   4  
      5   5  
      6   6  
      7   7  
      8   8  
      9   9  
      10  0

可以看到，这个表的初始化使用了两个SETLIST指令。第一个处理前50个，C为1，设置id从(C-1)50 + 1开始，也就是1。第二个处理余下的3个，C为2，设置的id从(C-1)50 + 1开始，也就是51。

如果数据非常大，导致需要的批次超出了C的表示范围，那么C会被设置成0，然后在SETLIST指令后面生成一个EXTRAARG指令，并用其Ax来存储批次。这与前面说到的LOADKX的处理方法一样，都是为处理超大数据服务的。

如果使用核能产生多个返回值的表达式（... 和函数调用）初始化数组项，如果这个初始化不是表构造的最后一项，那么只有第一个返回值会被设置到数组项；如果是最后一项，那么SETLIST中的B会被设置为0，表示从A+1到当前栈顶都用来设置。

SETLIST只负责初始化表的数组部分，对于hash部分，还是通过SETTABLE来初始化。

name	args	desc
OP_GETTABLE	A B C	R(A) := R(B)[RK(C)]
OP_SETTABLE	A B C	R(A)[RK(B)] := RK(C)

GETTABLE使用C表示的key，将寄存器B中的表项值获取到寄存器A中。SETTABLE设置寄存器A的表的B项为C代表的值。

  local a = {};  
  a.x = 1;  
  local b = a.x;

  1   [1] NEWTABLE    0 0 0  
  2   [2] SETTABLE    0 -1 -2 ; "x" 1  
  3   [3] GETTABLE    1 0 -1  ; "x"