前言
.net 2.0中泛型的出现是一个令人激动的特征。但是,什么是泛型?你需要它们吗?你会在自己的应用软件中使用它们?在本文中,我们将回答这些问题并细致地分析泛型的使用,能力及其局限性。
类型安全
.net中的许多语言如c#,c++和vb.net(选项strict为on)都是强类型语言。作为一个程序员,当你使用这些语言时,总会期望编译器进行类型安全的检查。例如,如果你把对一个book类型的引用转换成一个vehicle型的引用,编译器将告诉你这样的cast是无效的。
然而,当谈到.net 1.0和1.1中的集合时,它们是无助于类型安全的。请考虑一个arraylist的例子,它拥有一个对象集合--这允许你把任何类型的对象放于该arraylist中。让我们看一下例1中的代码。
例1.缺乏类型安全的arraylist
using system;
using system.collections;
namespace testapp
{
class test
{
[stathread]
static void main(string[] args)
{
arraylist list = new arraylist();
list.add(3);
list.add(4);
//list.add(5.0);
int total = 0;
foreach(int val in list)
{
total = total + val;
}
console.writeline("total is {0}", total);
}
}
}
本例中,我们建立了一个arraylist的实例,并把3和4添加给它。然后我循环遍历该arraylist,从中取出整型值然后把它们相加。这个程序将产生结果"total is 7"。现在,如果我注释掉下面这句:
list.add(5.0);
程序将产生如下的运行时刻异常:
unhandled exception: system.invalidcastexception: specified cast is not valid.
attestapp.test.main(string[]args)in :workareatestappclass1.cs:line 17
哪里出错了呢?记住arraylist拥有一个集合的对象。当你把3加到arraylist上时,你已把值3装箱了。当你循环该列表时,你是把元素拆箱成int型。然而,当你添加值5.0时,你在装箱一个double型值。在第17行,那个double值被拆箱成一个int型。这就是失败的原因。
注意:上面的实例,如果是用vb.net书写的话,是不会失败的。原因在于,vb.net不使用装箱机制,它激活一个把该double转换成整型的方法。但是,如果arraylist中的值是不能转换成整型的,vb.net代码还会失败。
作为一个习惯于使用语言提供的类型安全的程序员,你希望这样的问题在编译期间浮出水面,而不是在运行时刻。这正是泛型产生的原因。
3. 什么是泛型?
泛型允许你在编译时间实现类型安全。它们允许你创建一个数据结构而不限于一特定的数据类型。然而,当使用该数据结构时,编译器保证它使用的类型与类型安全是相一致的。泛型提供了类型安全,但是没有造成任何性能损失和代码臃肿。在这方面,它们很类似于c++中的模板,不过它们在实现上是很不同的。
4. 使用泛型集合
.net 2.0的system.collections.generics 命名空间包含了泛型集合定义。各种不同的集合/容器类都被"参数化"了。为使用它们,只需简单地指定参数化的类型即可。请看例2:
例2.类型安全的泛型列表
list<int> alist = new list<int>();
alist.add(3);
alist.add(4);
// alist.add(5.0);
int total = 0;
foreach(int val in alist)
{
total = total + val;
}
console.writeline("total is {0}", total);
在例2中,我编写了一个泛型的列表的例子,在尖括号内指定参数类型为int。该代码的执行将产生结果"total is 7"。现在,如果我去掉语句doublelist.add(5.0)的注释,我将得到一个编译错误。编译器指出它不能发送值5.0到方法add(),因为该方法仅接受int型。不同于例1,这里的代码实现了类型安全。
5. clr对于泛型的支持
泛型不仅是一个语言级上的特征。.net clr能识别出泛型。在这种意义上说,泛型的使用是.net中最为优秀的特征之一。对每个用于泛型化的类型的参数,类也同样没有脱离开微软中间语言(msil)。换句话说,你的配件集仅包含你的参数化的数据结构或类的一个定义,而不管使用多少种不同的类型来表达该参数化的类型。例如,如果你定义一个泛型类型mylist<t>,仅仅该类型的一个定义出现在msil中。当程序执行时,不同的类被动态地创建,每个类对应该参数化类型的一种类型。如果你使用mylist<int>和mylist<double>,有两种类即被创建。当你的程序执行时,让我们进一步在例3中分析这一点。
例3.创建一个泛型类
//mylist.cs
#region using directives
using system;
using system.collections.generic;
using system.text;
#endregion
namespace clrsupportexample
{
public class mylist<t>
{
private static int objcount = 0;
public mylist()
{objcount++; }
public int count
{
get
{return objcount; }
}
}
}
该例中,我创建了一个称为mylist泛型类。为把它参数化,我简单地插入了一个尖括号。在<>内的t代表了实际的当使用该类时要指定的类型。在mylist类中,定义了一个静态字段objcount。我在构造器中增加它的值。因此我能发现使用我的类的用户共创建了多少个那种类型的对象。属性count返回与被调用的实例同类型的实例的数目。
在main()方法,我创建了mylist<int>的两个实例,一个mylist<double>的实例,还有两个mylist<sampleclass>的实例--其中sampleclass是我已定义了的类。问题是:count(上面的程序的输出)的值该是多少?在你继阅读之前,试一试回答这个问题。
解决了上面的问题?你得到下列的答案了吗?
2
2
1
1
2
前面两个2对应mylist<int>,第一个1对应mylist<double>,第二个1对应mylist<sampleclass>--在此,仅创建一个这种类型的实例。最后一个2对应mylist<sampleclass>,因为代码中又创建了这种类型的另外一个实例。上面的例子说明mylist<int>是一个与mylist<double>不同的类,而mylist<double>又是一个与mylist<sampleclass>不同的类。因此,在这个例中,我们有四个类:mylist: mylist<t>,mylist<int>,mylist<double>和mylist<x>。注意,虽然有4个mylist类,但仅有一个被存储在msil。怎么能证明这一点?请看图1显示出的使用工具ildasm.exe生成的msil代码。
6. 泛型方法
除了有泛型类,你也可以有泛型方法。泛型方法可以是任何类的一部分。让我们看一下例4:
例4.一个泛型方法
public class program
{
public static void copy<t>(list<t> source, list<t> destination)
{
foreach (t obj in source)
{
destination.add(obj);
}
}
static void main(string[] args)
{
list<int> lst1 = new list<int>();
lst1.add(2);
lst1.add(4);
list<int> lst2 = new list<int>();
copy(lst1, lst2);
console.writeline(lst2.count);
}
}
copy()方法就是一个泛型方法,它与参数化的类型t一起工作。当在main()中激活copy()时,编译器根据提供给copy()方法的参数确定出要使用的具体类型。
7. 无限制的类型参数
如果你创建一个泛型数据结构或类,就象例3中的mylist,注意其中并没有约束你该使用什么类型来建立参数化类型。然而,这带来一些限制。如,你不能在参数化类型的实例中使用象==,!=或<等运算符,如:
if (obj1 == obj2) …
象==和!=这样的运算符的实现对于值类型和引用类型都是不同的。如果随意地允许之,代码的行为可能很出乎你的意料。另外一种限制是缺省构造器的使用。例如,如果你编码象new t(),会出现一个编译错,因为并非所有的类都有一个无参数的构造器。如果你真正编码象new t()来创建一个对象,或者使用象==和!=这样的运算符,情况会是怎样呢?你可以这样做,但首先要限制可被用于参数化类型的类型。读者可以自己先考虑如何实现之。
8. 约束机制及其优点
一个泛型类允许你写自己的类而不必拘泥于任何类型,但允许你的类的使用者以后可以指定要使用的具体类型。通过对可能会用于参数化的类型的类型施加约束,这给你的编程带来很大的灵活性--你可以控制建立你自己的类。让我们分析一个例子:
例5.需要约束:代码不会编译成功
public static t max<t>(t op1, t op2)
{
if (op1.compareto(op2) < 0)
return op1;
return op2;
}
例5中的代码将产生一个编译错误:
error 1 ’t’ does not contain a definition for ’compareto’
假定我需要这种类型以支持compareto()方法的实现。我能够通过加以约束--为参数化类型指定的类型必须要实现icomparable接口--来指定这一点。例6中的代码就是这样:
例6.指定一个约束
public static t max<t>(t op1, t op2) where t : icomparable
{
if (op1.compareto(op2) < 0)
return op1;
return op2;
}
在例6中,我指定的约束是,用于参数化类型的类型必须继承自(实现)icomparable。下面的约束是可以使用的:
where t : struct 类型必须是一种值类型(struct)
where t : class 类型必须是一种引用类型(class)
where t : new() 类型必须有一个无参数的构造器
where t : class_name 类型可以是class_name或者是它的一个子类
where t : interface_name 类型必须实现指定的接口
你可以指定约束的组合,就象: where t : icomparable, new()。这就是说,用于参数化类型的类型必须实现icomparable接口并且必须有一个无参构造器。
9. 继承与泛型
一个使用参数化类型的泛型类,象myclass1<t>,称作开放结构的泛型。一个不使用参数化类型的泛型类,象myclass1<int>,称作封闭结构的泛型。
你可以从一个封闭结构的泛型进行派生;也就是说,你可以从另外一个称为myclass1的类派生一个称为myclass2的类,就象:
public class myclass2<t> : myclass1<int>
你也可以从一个开放结构的泛型进行派生,如果类型被参数化的话,如:
public class myclass2<t> : myclass2<t>
是有效的,但是
public class myclass2<t> : myclass2<y>
是无效的,这里y是一个被参数化的类型。非泛型类可以从一个封闭结构的泛型类进行派生,但是不能从一个开放结构的泛型类派生。即:
public class myclass : myclass1<int>
是有效的, 但是
public class myclass : myclass1<t>
是无效的。
10. 泛型和可代替性
当我们使用泛型时,要小心可代替性的情况。如果b继承自a,那么在使用对象a的地方,可能都会用到对象b。假定我们有一篮子水果(a basket of fruits (basket<fruit>)),而且有继承自fruit的apple和banana(皆为fruit的种类)。一篮子苹果--basket of apples (basket<apple>)可以继承自basket of fruits (basket<fruit>)?答案是否定的,如果我们考虑一下可代替性的话。为什么?请考虑一个a basket of fruits可以工作的方法:
public void package(basket<fruit> abasket)
{
abasket.add(new apple());
abasket.add(new banana());
}
basket<apple> anapplebasket = new basket<apple>();
package(anapplebasket);
会产生错误:
error 2 argument ’1’:
cannot convert from ’testapp.basket<testapp.apple>’
to ’testapp.basket<testapp.fruit>’
编译器通过确保我们不会随意地传递一个集合的派生类(此时需要一个集合的基类),保护了我们的代码。这不是很好吗?
这在上面的例中在成功的,但也存在特殊情形:有时我们确实想传递一个集合的派生类,此时需要一个集合的基类。例如,考虑一下animal(如monkey),它有一个把basket<fruit>作参数的方法eat,如下所示:
public void eat(basket<fruit> fruits)
{
foreach (fruit afruit in fruits)
{
//将吃水果的代码
}
}
现在,你可以调用:
basket<fruit> fruitsbasket = new basket<fruit>();
… //添加到basket对象中的对象fruit
ananimal.eat(fruitsbasket);
如果你有一篮子(a basket of)banana-一basket<banana>,情况会是如何呢?把一篮子(a basket of)banana-一basket<banana>发送给eat方法有意义吗?在这种情形下,会成功吗?真是这样的话,编译器会给出错误信息:
basket<banana> bananabasket = new basket<banana>();
//…
ananimal.eat(bananabasket);
编译器在此保护了我们的代码。我们怎样才能要求编译器允许这种特殊情形呢?约束机制再一次帮助了我们:
public void eat<t>(basket<t> fruits) where t : fruit
{
foreach (fruit afruit in fruits)
{
//将吃水果的代码
}
}
在建立方法eat()的过程中,我要求编译器允许一篮子(a basket of)任何类型t,这里t是fruit类型或任何继承自fruit的类。
11. 泛型和代理
代理也可以是泛型化的。这样就带来了巨大的灵活性。
假定我们对写一个框架程序很感兴趣。我们需要提供一种机制给事件源以使之可以与对该事件感兴趣的对象进行通讯。我们的框架可能无法控制事件是什么。你可能在处理某种股票价格变化(double price),而我可能在处理水壶中的温度变化(temperature value),这里temperature可以是一种具有值、单位、门槛值等信息的对象。那么,怎样为这些事件定义一接口呢?
让我们通过pre-generic代理技术细致地分析一下如何实现这些:
public delegate void notifydelegate(object info);
public interface isource
{
event notifydelegate notifyactivity;
}
让我们看两个不同的源码:
public class stockpricesource : isource
{
public event notifydelegate notifyactivity;
//…
}
public class boilersource : isource
{
public event notifydelegate notifyactivity;
//…
}
如果我们各有一个上面每个类的对象,我们将为事件注册一个处理器,如下所示:
stockpricesource stocksource = new stockpricesource();
stocksource.notifyactivity
+= new notifydelegate(stocksource_notifyactivity);
//这里不必要出现在同一个程序中
boilersource boilersource = new boilersource();
boilersource.notifyactivity
+= new notifydelegate(boilersource_notifyactivity);
在代理处理器方法中,我们要做下面一些事情:
对于股票事件处理器,我们有:
void stocksource_notifyactivity(object info)
{
double price = (double)info;
//在使用前downcast需要的类型
}
温度事件的处理器看上去会是:
void boilersource_notifyactivity(object info)
{
temperature value = info as temperature;
//在使用前downcast需要的类型
}
上面的代码并不直观,且因使用downcast而有些凌乱。借助于泛型,代码将变得更易读且更容易使用。让我们看一下泛型的工作原理:
下面是代理和接口:
public delegate void notifydelegate<t>(t info);
public interface isource<t>
{
event notifydelegate<t> notifyactivity;
}
我们已经参数化了代理和接口。现在的接口的实现中应该能确定这是一种什么类型。
stock的源代码看上去象这样:
public class stockpricesource : isource<double>
{
public event notifydelegate<double> notifyactivity;
//…
}
而boiler的源代码看上去象这样:
public class boilersource : isource<temperature>
{
public event notifydelegate<temperature> notifyactivity;
//…
}
如果我们各有一个上面每种类的对象,我们将象下面这样来为事件注册一处理器:
stockpricesource stocksource = new stockpricesource();
stocksource.notifyactivity += new notifydelegate<double>(stocksource_notifyactivity);
//这里不必要出现在同一个程序中
boilersource boilersource = new boilersource();
boilersource.notifyactivity += new notifydelegate<temperature>(boilersource_notifyactivity);
现在,股票价格的事件处理器会是:
void stocksource_notifyactivity(double info)
{ //… }
void boilersource_notifyactivity(temperature info)
{ //… }
这里的代码没有作downcast并且使用的类型是很清楚的。
12. 泛型与反射
既然泛型是在clr级上得到支持的,你可以使用反射api来取得关于泛型的信息。如果你是编程的新手,可能有一件事让你疑惑:你必须记住既有你写的泛型类也有在运行时从该泛型类创建的类型。因此,当使用反射api时,你需要另外记住你在使用哪一种类型。我将在例7说明这一点:
例7.在泛型上的反射
public class myclass<t> { }
class program
{
static void main(string[] args)
{
myclass<int> obj1 = new myclass<int>();
myclass<double> obj2 = new myclass<double>();
type type1 = obj1.gettype();
type type2 = obj2.gettype();
console.writeline("obj1’s type");
console.writeline(type1.fullname);
console.writeline(type1.getgenerictypedefinition().fullname);
console.writeline("obj2’s type");
console.writeline(type2.fullname);
console.writeline(type2.getgenerictypedefinition().fullname);
}
}
在本例中,有一个myclass<int>的实例,程序中要查询该实例的类名。然后我查询这种类型的generictypedefinition()。generictypedefinition()会返回myclass<t>的类型元数据。你可以调用isgenerictypedefinition来查询是否这是一个泛型类型(象myclass<t>)或者是否已指定它的类型参数(象myclass<int>)。同样地,我查询myclass<double>的实例的元数据。上面的程序输出如下:
obj1’s type
testapp.myclass`1
[[system.int32, mscorlib, version=2.0.0.0, culture=neutral,
publickeytoken=b77a5c561934e089]]
testapp.myclass`1
obj2’s type
testapp.myclass`1
[[system.double, mscorlib, version=2.0.0.0, culture=neutral,
publickeytoken=b77a5c561934e089]]
testapp.myclass`1
可以看到,myclass<int>和myclass<double>是属于mscorlib配件集的类(动态创建的),而类myclass<t>属于我自建的配件集。
13. 泛型的局限性
至此,我们已了解了泛型的强大威力。是否其也有不足呢?我发现了一处。我希望微软能够明确指出泛型存在的这一局制性。在表达约束的时候,我们能指定参数类型必须继承自一个类。然而,指定参数必须是某种类的基类型该如何呢?为什么要那样做呢?
在例4中,我展示了一个copy()方法,它能够把一个源list的内容复制到一个目标list中去。我可以象如下方式使用它:
list<apple> applelist1 = new list<apple>();
list<apple> applelist2 = new list<apple>();
…
copy(applelist1, applelist2);
然而,如果我想要把apple对象从一个列表复制到另一个fruit列表(apple继承自fruit),情况会如何呢?当然,一个fruit列表可以容纳apple对象。所以我要这样编写代码:
list<apple> applelist1 = new list<apple>();
list<fruit> fruitslist2 = new list<fruit>();
…
copy(applelist1, fruitslist2);
error 1 the type arguments for method
’testapp.program.copy<t>(system.collections.generic.list<t>,
system.collections.generic.list<t>)’ cannot be inferred from the usage.
编译器基于调用参数并不能决定t应该是什么。其实我想说,copy方法应该接受一个某种数据类型的list作为第一个参数,一个相同类型的list或者它的基类型的list作为第二个参数。
尽管无法说明一种类型必须是另外一种类型的基类型,但是你可以通过仍旧使用约束机制来克服这一限制。下面是这种方法的实现:
public static void copy<t, e>(list<t> source,
list<e> destination) where t : e
在此,我已指定类型t必须和e属同一种类型或者是e的子类型。我们很幸运。为什么?t和e在这里都定义了!我们能够指定这种约束(然而,c#中并不鼓励当e也被定义的时候使用e来定义对t的约束)。
然而,请考虑下列的代码:
public class mylist<t>
{
public void copyto(mylist<t> destination)
{
//…
}
}
我应该能够调用copyto:
mylist<apple> applelist = new mylist<apple>();
mylist<apple> applelist2 = new mylist<apple>();
//…
applelist.copyto(applelist2);
我也必须这样做:
mylist<apple> applelist = new mylist<apple>();
mylist<fruit> fruitlist2 = new mylist<fruit>();
//…
applelist.copyto(fruitlist2);
这当然不会成功。如何修改呢?我们说,copyto()的参数可以是某种类型的mylist或者是这种类型的基类型的mylist。然而,约束机制不允许我们指定一个基类型。下面情况又该如何呢?
public void copyto<e>(mylist<e> destination) where t : e
抱歉,这并不工作。它将给出一个编译错误:
error 1 ’testapp.mylist<t>.copyto<e>()’ does not define type
parameter ’t’
当然,你可以把代码写成接收任意类型的mylist,然后在代码中,校验该类型是可以接收的类型。然而,这把检查工作推到了运行时刻,丢掉了编译时类型安全的优点。
14. 结论
.net 2.0中的泛型是强有力的,你写的代码不必限定于一特定类型,然而你的代码却能具有类型安全性。泛型的实现目标是既提高程序的性能又不造成代码的臃肿。然而,在它的约束机制存在不足(无法指定一类型必须是另外一种类型的基类型)的同时,该约束机制也给你书写代码带来很大的灵活性,因为你不必拘泥于各种类型的"最小公分母"能力。