闭包

闭包向来给包括 JavaScript 程序员在内的程序员以神秘,高深的感觉,事实上,闭包的概念在函数式编程语言中算不上是难以理解的知识。如果对作用域,函数为独立的对象这样的基本概念理解较好的话,理解闭包的概念并在实际的编程实践中应用则颇有水到渠成之感。

在 DOM 的事件处理方面,大多数程序员甚至自己已经在使用闭包了而不自知,在这种情况下,对于浏览器中内嵌的 JavaScript 引擎的 bug 可能造成内存泄漏这一问题姑且不论,就是程序员自己调试也常常会一头雾水。

用简单的语句来描述 JavaScript 中的闭包的概念:由于 JavaScript 中,函数是对象,对象是属性的集合,而属性的值又可以是对象,则在函数内定义函数成为理所当然,如果在函数 func 内部声明函数 inner,然后在函数外部调用 inner,这个过程即产生了一个闭包。

闭包的特性

我们先来看一个例子,如果不了解 JavaScript 的特性,很难找到原因:

var outter = [];  
function clouseTest () {  
    var array = ["one", "two", "three", "four"];  
    for(var i = 0; i < array.length;i++){  
       var x = {};  
       x.no = i;  
       x.text = array[i];  
       x.invoke = function(){  
           print(i);  
       }  
       outter.push(x);  
    }  
}  

//调用这个函数  
clouseTest();  

print(outter[0].invoke());  
print(outter[1].invoke());  
print(outter[2].invoke());  
print(outter[3].invoke());

运行的结果如何呢?很多初学者可能会得出这样的答案:

0
1
2
3

然而,运行这个程序,得到的结果为:

4
4
4
4

其实,在每次迭代的时候,这样的语句 x.invoke = function(){print(i);}并没有被执行,只是构建了一个函数体为"print(i);"的函数对象,如此而已。而当 i=4 时,迭代停止,外部函数返回,当再去调用 outter[0].invoke()时,i的值依旧为4,因此outter数组中的每一个元素的invoke都返回i的值:4

如何解决这一问题呢?我们可以声明一个匿名函数,并立即执行它:

var outter = [];  

function clouseTest2(){  
    var array = ["one", "two", "three", "four"];  
    for(var i = 0; i < array.length;i++){  
       var x = {};  
       x.no = i;  
       x.text = array[i];  
       x.invoke = function(no){  
           return function(){  
              print(no);  
           }  
       }(i);  
       outter.push(x);  
    }    
}  

clouseTest2();

这个例子中,我们为 x.invoke 赋值的时候,先运行一个可以返回一个函数的函数,然后立即执行之,这样,x.invoke 的每一次迭代器时相当与执行这样的语句:

//Java代码  
//x == 0  
x.invoke = function(){print(0);}  
//x == 1  
x.invoke = function(){print(1);}  
//x == 2  
x.invoke = function(){print(2);}  
//x == 3  
x.invoke = function(){print(3);}  

这样就可以得到正确结果了。闭包允许你引用存在于外部函数中的变量。然而,它并不是使用该变量创建时的值,相反,它使用外部函数中该变量最后的值。

闭包的用途

现在,闭包的概念已经清晰了,我们来看看闭包的用途。事实上,通过使用闭包,我们可以做很多事情。比如模拟面向对象的代码风格;更优雅,更简洁的表达出代码;在某些方面提升代码的执行效率。

匿名自执行函数

上一节中的例子,事实上就是闭包的一种用途,根据前面讲到的内容可知,所有的变量,如果不加上var关键字,则默认的会添加到全局对象的属性上去,这样的临时变量加入全局对象有很多坏处,比如:别的函数可能误用这些变量;造成全局对象过于庞大,影响访问速度(因为变量的取值是需要从原型链上遍历的)。除了每次使用变量都是用var 关键字外,我们在实际情况下经常遇到这样一种情况,即有的函数只需要执行一次,其内部变量无需维护,比如 UI 的初始化,那么我们可以使用闭包:

var datamodel = {  
    table : [],  
    tree : {}  
};  

(function(dm){  
    for(var i = 0; i < dm.table.rows; i++){  
       var row = dm.table.rows[i];  
       for(var j = 0; j < row.cells; i++){  
           drawCell(i, j);  
       }  
    }  

    //build dm.tree    
})(datamodel); 

我们创建了一个匿名的函数,并立即执行它,由于外部无法引用它内部的变量,因此在执行完后很快就会被释放,关键是这种机制不会污染全局对象。

缓存

再来看一个例子,设想我们有一个处理过程很耗时的函数对象,每次调用都会花费很长时间,那么我们就需要将计算出来的值存储起来,当调用这个函数的时候,首先在缓存中查找,如果找不到,则进行计算,然后更新缓存并返回值,如果找到了,直接返回查找到的值即可。闭包正是可以做到这一点,因为它不会释放外部的引用,从而函数内部的值可以得以保留。

var CachedSearchBox = (function(){  
    var cache = {},  
       count = [];  
    return {  
       attachSearchBox : function(dsid){  
           if(dsid in cache){//如果结果在缓存中  
              return cache[dsid];//直接返回缓存中的对象  
           }  
           var fsb = new uikit.webctrl.SearchBox(dsid);//新建  
           cache[dsid] = fsb;//更新缓存  
           if(count.length > 100){//保正缓存的大小<=100  
              delete cache[count.shift()];  
           }  
           return fsb;        
       },  

       clearSearchBox : function(dsid){  
           if(dsid in cache){  
              cache[dsid].clearSelection();    
           }  
       }  
    };  
})();  

CachedSearchBox.attachSearchBox("input1");  

这样,当我们第二次调用 CachedSearchBox.attachSerachBox("input1")的时候,我们就可以从缓存中取道该对象,而不用再去创建一个新的 searchbox 对象。

实现封装

可以先来看一个关于封装的例子,在 person 之外的地方无法访问其内部的变量,而通过提供闭包的形式来访问:

var person = function(){  
    //变量作用域为函数内部,外部无法访问  
    var name = "default";     

    return {  
       getName : function(){  
           return name;  
       },  
       setName : function(newName){  
           name = newName;  
       }  
    }  
}();  

print(person.name);//直接访问,结果为undefined  
print(person.getName());  
person.setName("abruzzi");  
print(person.getName());

得到结果如下:

undefined
default
abruzzi

闭包的另一个重要用途是实现面向对象中的对象,传统的对象语言都提供类的模板机制,这样不同的对象(类的实例)拥有独立的成员及状态,互不干涉。虽然 JavaScript 中没有类这样的机制,但是通过使用闭包,我们可以模拟出这样的机制。还是以上边的例子来讲:

function Person(){  
    var name = "default";     

    return {  
       getName : function(){  
           return name;  
       },  
       setName : function(newName){  
           name = newName;  
       }  
    }  
};  

var john = Person();  
print(john.getName());  
john.setName("john");  
print(john.getName());  

var jack = Person();  
print(jack.getName());  
jack.setName("jack");  
print(jack.getName());

运行结果如下:

default
john
default
jack

由此代码可知,john 和 jack 都可以称为是 Person 这个类的实例,因为这两个实例对 name 这个成员的访问是独立的,互不影响的。

事实上,在函数式的程序设计中,会大量的用到闭包,我们将在第八章讨论函数式编程,在那里我们会再次探讨闭包的作用。

应该注意的问题

内存泄漏

在不同的 JavaScript 解释器实现中,由于解释器本身的缺陷,使用闭包可能造成内存泄漏,内存泄漏是比较严重的问题,会严重影响浏览器的响应速度,降低用户体验,甚至会造成浏览器无响应等现象。

JavaScript 的解释器都具备垃圾回收机制,一般采用的是引用计数的形式,如果一个对象的引用计数为零,则垃圾回收机制会将其回收,这个过程是自动的。但是,有了闭包的概念之后,这个过程就变得复杂起来了,在闭包中,因为局部的变量可能在将来的某些时刻需要被使用,因此垃圾回收机制不会处理这些被外部引用到的局部变量,而如果出现循环引用,即对象A引用B,B引用C,而C又引用到A,这样的情况使得垃圾回收机制得出其引用计数不为零的结论,从而造成内存泄漏。

上下文的引用

关于 this 我们之前已经做过讨论,它表示对调用对象的引用,而在闭包中,最容易出现错误的地方是误用了 this。在前端 JavaScript 开发中,一个常见的错误是错将 this 类比为其他的外部局部变量:

$(function(){  
    var con = $("div#panel");  
    this.id = "content";  
    con.click(function(){  
       alert(this.id);//panel  
    });  
});  

此处的 alert(this.id)到底引用着什么值呢?很多开发者可能会根据闭包的概念,做出错误的判断:

content

理由是,this.id 显示的被赋值为 content,而在 click 回调中,形成的闭包会引用到 this.id,因此返回值为 content。然而事实上,这个 alert 会弹出"panel",究其原因,就是此处的this,虽然闭包可以引用局部变量,但是涉及到 this 的时候,情况就有些微妙了,因为调用对象的存在,使得当闭包被调用时(当这个panel的click事件发生时),此处的 this 引用的是 con 这个 jQuery 对象。而匿名函数中的 this.id = "content"是对匿名函数本身做的操作。两个 this 引用的并非同一个对象。

如果想要在事件处理函数中访问这个值,我们必须做一些改变:

$(function(){  
    var con = $("div#panel");  
    this.id = "content";  
    var self = this;  
    con.click(function(){  
       alert(self.id);//content  
    });  
});  

这样,我们在事件处理函数中保存的是外部的一个局部变量 self 的引用,而并非 this。这种技巧在实际应用中多有应用,我们在后边的章节里进行详细讨论。关于闭包的更多内容,我们将在第九章详细讨论,包括讨论其他命令式语言中的"闭包",闭包在实际项目中的应用等等。