站长资源脚本专栏
实现Lua中数据类型的源码分享
概述
在Lua中有8种基础类型:nil、boolean、number、string、userdata、function、thread和table。可以使用函数type查看某个变量或值的类型,返回相应的类型名称。像其他动态语言一样,在语言中没有类型定义的语法,每个值都携带了它自身的类型信息。下面将通过Lua 5.2.1的源码来看类型的实现。
源码实现
Lua将值表示成带标志的联合结构,代码如下(lobject.h):
90 /* 91 ** Union of all Lua values 92 */ 93 typedef union Value Value; 100 /* 101 ** Tagged Values. This is the basic representation of values in Lua, 102 ** an actual value plus a tag with its type. 103 */ 104 105 #define TValuefields Value value_; int tt_ 400 struct lua_TValue { 401 TValuefields; 402 };
可以看出结构体有两个成员:
一个是整型的tt_用来表示数据类型,Lua中所有的数据类型定义如下(lua.h):
78 #define LUA_TNIL 0 79 #define LUA_TBOOLEAN 1 80 #define LUA_TLIGHTUSERDATA 2 81 #define LUA_TNUMBER 3 82 #define LUA_TSTRING 4 83 #define LUA_TTABLE 5 84 #define LUA_TFUNCTION 6 85 #define LUA_TUSERDATA 7 86 #define LUA_TTHREAD 8
可以看到实现了9种数据类型,其中把语法中userdata分为LUA_TLIGHTUSERDATA和LUA_TUSERDATA,其中前一种类型即为轻量级userdata(light userdata),轻量级userdata是一种表示C指针的值,对Lua虚拟机来说,这种数据类型不需要GC(垃圾回收),其指向的内存由用户分配和释放;后一种userdata类型完全userdata(full userdata),内存是由Lua虚拟机分配,并有GC机制负责处理。
结构体lua_TValue另一个数据成员是value_,它是一个联合体,代码如下(lobject.h):
96 #define numfield lua_Number n; /* numbers */ 103 typedef LUA_NUMBER lua_Number;(lua.h) 392 #define LUA_NUMBER double(luaconf.h) 391 union Value { 392 GCObject *gc; /* collectable objects */ 393 void *p; /* light userdata */ 394 int b; /* booleans */ 395 lua_CFunction f; /* light C functions */ 396 numfield /* numbers */ 397 };
通过注释,可以很容易理解每个成员的含义,但有必要对以下几个成员说明:
numfield:用来表示所有数值,其实质对应的是double类型。包括整型也是用这个来表示。另外在Lua 5.3实现,分开了整型和浮点数的表示。
GCObject *gc:用来指向那些需要垃圾回收的对象,包括string、table、function、完全userdata和thread类型。GCObject用来表示可以垃圾回收的对象,它也是一个联合体,其代码如下(lstate.h)
185 union GCObject { 186 GCheader gch; /* common header */ 187 union TString ts; 188 union Udata u; 189 union Closure cl; 190 struct Table h; 191 struct Proto p; 192 struct UpVal uv; 193 struct lua_State th; /* thread */ 194 };
其中成员GCheader gch主要用于GC回收机制使用。其他成员比如TString ts才是真正存储值的结构,而这些数据结构也会有GCheader,用于GC管理。
总的来说,Lua中各种数值类型结构如下:
最后,关于Lua的数据类型实现,值得指出使用带标志的结构体来表示Lua的数值类型,使得Lua中任何一种数据类型至少占用的空间是个16字节(结构体还需要对其),就算nil类型,也会占用8个字节的空间,因此拷贝Lua值是比较耗时的。下一篇文章将讨论Lua字符串的实现。
以上所述就是本文的全部内容了,希望大家能够喜欢。