前言
理解javascript中的作用域和作用域链对我们理解js这们语言。这次想深入的聊下关于js执行的内部机制,
主要讨论下,作用域,作用域链,闭包的概念。为了更好的理解这些东西,我模拟了当一个函数执行时,js引擎做了哪些事情--那些我们看不见的动作。关键词:
- 执行环境
- 作用域
- 作用域链
- 变量对象
- 活动对象
- 闭包
- 垃圾回收
执行环境与作用域链
我们都知道js的执行环境最外层是一个全局环境Global,在web浏览器的宿主环境下,window对象被认为是全局执行环境。在后台的nodejs环境global作为全局变量也是我们可以直接访问到的。
某个执行环境中所有代码执行完毕后,该环境被销毁,保存在其中的所有变量和函数定义也随之销毁(全局环境到应用退出--如关闭网页或浏览器)每个函数也有自己的执行环境,当执行流进入函数时,函数的环境被推入一个环境栈中,函数执行完毕之后,栈将其环境弹出,把控制权返回给之前的执行环境。
当代码在一个环境中执行时,会创建创建变量对象的一个作用域链
。
下面我们模拟下这个过程。
var name = "eric";function say(){ var name = "xu"; console.log(name);}say();//xu
输出“xu”,而不是“eric”,这个我们也许都很好理解,因为函数内部定义了局部同名变量name,而不会使用全局的name。上面的环境中包含全局变量name
和say
函数;当say执行时,js引擎做了些什么。下面我们模拟下引擎“偷偷”为我们做的事。
作用域链的产生过程
首先say()执行时会创建一个执行环境,为了形象一些,我这里以三个大括号可视化表示一个执行环境。如:say(){
{ {...}}}这个执行环境中会自动拥有一个特殊的内部属性[[Scope]]
(为了更好的理解,可以把它想象成如果是全局环境的window,全局环境定义的变量和函数附着在这个变量上自动成为window的属性和方法,这样的一个局部功能“局部内全局对象”。但其实局部的变量和函数会被附着在其活动对象上,活动对象又是作用域链第一个变量对象。)
函数调用时与执行环境同时创建的就是相应的作用域链
[[Scope Chain]],并赋值给特殊变量Scope;
//step 1:创建执行环境,为了形象一些,我这里以三个大括号可视化表示一个执行环境{ { {...}}}
//step 2:创建作用域链,并赋值给特殊变量Scope,我们用数组来模拟这个作用域链,随后我会解释为什么用数组模拟var ScopeChain = [ FirstVariableObject,//函数内的变量对象 SecondVariableObject //包含这个函数的外面一层的变量对象,在上面的例子中已经是全局环境了。]Scope = ScopeChain;
在作用域链生成之前,其实还有步骤,那就是作用域链数组的两个变量对象的生成。那这两个变量对象是什么呢?
其实第一个变量对象就是函数的活动对象
【activation object】,这个活动对象可以理解成这样一个对象
ActivationObject = { arguments: [] //活动对象最开始仅包含arguments(就是函数内隐藏的arguments)}
然后内部this根据环境,加入活动对象
ActivationObject = { arguments: [], //活动对象最开始仅包含arguments(就是函数内隐藏的arguments) this: window //这里的this根据执行环境和调用对象的不同,会动态变化,上面的例子因为是全局环境执行的所以this指向window}
然后开始寻找var的变量定义,或者函数声明(我们都知道的函数声明会被提升)。
此时的活动对象变成://活动对象,即函数内部所有变量的综合,会自动成为第一个变量对象ActivationObject = { arguments: [], this: window, name: undefined //注意引擎此时并不会初始化赋值,只有读到赋值那一行时才会赋值}
这样我们就能很好的理解我们熟悉的经典例子,为什么下面的console.log不会报错,也不是输出'xu',而是undefined
因为我们的活动对象会自动变为第一个活动对象,所以第一个变量对象就等于活动对象
FirstVariableObject = ActivationObject;
同理作用域中的第二个变量对象SecondVariableObject,或者我们也可以命名为GlobalVariableObject,因为在上面的例子中已经是全局环境了
//作用域链的第二个,也是最后一个(全局变量对象)SecondVariableObject = { this: window, say: function (){...}, name: "eric"}
第二个变量对象不包含arguments,因为它是全局环境,而不是函数。say函数声明被提升作为window的全局方法,还有全局的name属性。都被挂在第二层的作用域链的变量对象上。
至此作用域链创建完毕。作用域链会成为这样的好理解的样子:
//形象的作用域链Scope = ScopeChain = [ { arguments: [], this: window, name: undefined }, { this: window, say: function (){...}, name: "eric" }]
作用域链查找在js执行过程中的模拟
然后js开始一句一句解析say函数的代码,
第一句,var name = "xu"
此时,活动对象的name值才会将undefined变为'xu';然后执行第二句console.log(name);
这句中有一个变量name
,这个时候作用域链就该出场了。 js引擎会开始执行查找,首先从ActivationObject活动对象中开始找,因为经过var name = "eric";
此时作用域链的第一个,即活动对象已经变成{ arguments: [], this: window, name: 'xu'}
所以输出‘xu’,而不是‘eric’
如果我们将say函数,做下改动如下:
var name = "eric";function say(){ var age = 99; console.log(name);}say();//eric
因为内部的没有定义name变量,这个结果不出意料的我们都知道,但这个过程我把它模拟成以下查找过程:
//从当前函数的活动对象开始,一层一层向上查找,直到顶层全局作用域//break这句相当重要,当前这一层找到了,不再向上一层找了。即在这一层环境中找到了变量namefor (var i=0;i
我觉得这段代码,可以非常形象的表达了作用域链的查找过程
,
这就是为什么我用数组去模拟作用域链的原因,因为作用域链可以理解是个有序列表(其实作用域链的本质就是指向变量对象的指针列表)
,查找过程是按顺序查找的。
通过上面的形象化解释,是不是非常好理解作用域和作用域链了呢!!!
垃圾回收
我们都知道在函数执行完毕之后,内部的变量和内部定义的函数会随之销毁,也就是被垃圾回收机制所回收,如下:
function talk(){ var name = 'eric'; function say(){ console.log(name); } say();}talk();
当talk函数执行后,内部的变量name
和声明的函数say
会从内存中销毁,但闭包的情况就不会。如:
function createTalk(){ var name = 'eric'; var age = 99; return function (){ var innerName = name; console.log(innerName); }}var talk = createTalk();talk();
闭包中没有释放局部变量的原因
闭包的本质其实是有权访问另一个函数作用域中变量的函数
根据我们上面模拟的作用域链模型,上面的例子中当talk执行时,整个作用域链可以形象化为:
ScopeChain = [ { arguments:[], this: window, innerName: undefined }, { arguments:[], this: window, name: eric, age: 99 }, { this: window, createTalk: function (){...}, talk: function (){...} //内部return的匿名函数 },]
这样当createTalk执行后,talk变量仍然保持了对函数内部变量和内部匿名函数的引用,因此即使createTalk执行完毕,虽然其执行环境被销毁,但返回的匿名函数的作用域链被初始化为createTalk()函数的活动对象和全局变量对象,内部变量仍然没有被垃圾回收机制所回收。虽然返回的匿名函数,仅使用了外一层的name变量,而没有使用age变量。但其内部保存的仍然是整个外层变量对象,即
{ arguments:[], this: window, name: eric, age: 99}
而不仅仅是外层的name变量一个值,因为查找过程中,使用的是整个的变量对象来查找的。因为是查找,所以存在遍历整个对象的过程,而不是简单的赋值
。
这就是为什么闭包会占用更多的内存的原因,因为其保存了整个变量对象。虽然我们的例子可能就几个,但在实际应用中可能存在非常多。
这也是我们要谨慎使用闭包的原因。闭包的经典实例
接下来我们看一个经典的闭包示例。
var result = [];for (var i=0;i<10;i++){ result[i] = function (){ return i; }}
结果或许大家都知道了,result数组的任何一个执行,都会返回10。下面我们用上面模拟的作用链,形象话的看下,
比如result[9]()函数执行的初始化作用域链如下:ScopeChain = [ //第一层是内部匿名函数的变量对象 { arguments:[], this: window }, //第二层是外部的,也就是全局变量对象 { this: window, result: [Array], i: 10 //此时全局环境的i已经经过for循环变成了10 },]
自然任何一个result的值调用函数,都会是返回10。
通过变形符合预期的闭包如下:var result = [];for (var i=0;i<10;i++){ result[i] = function (num){ return function (){ return num; } }(i);}
上面这个经典的闭包返回的就是我们想要的各自的i,为了更好理解,我还是使用形象的作用域链。
当匿名函数执行时,看下它的初始作用域链:ScopeChain = [ //第一层为传入参数i的自执行函数 { arguments:[], this: window, }, { arguments:[num], num: 9, this: window, } { this: window, result: [Array], i: 10 }]
我们可以理解为多了一层作用域链的变量对象,使其能保留对num副本的引用,而不是对i的引用。
好了,通过深入理解作用域链,我们能跟好的理解js的运行机制和闭包的原理。