从 Python 2.6 开始,标准库提供了抽象基类。大多数抽象基类在 collections.abc 模块中定义,不过其他地方也有。例如,numbers 和 io 包中有一些抽象基类。但是,collections.abc 中的抽象基类最常用。我们来看看这个模块中有哪些抽象基类。
collections.abc模块中的抽象基类
标准库中有两个名为
abc的模块,这里说的是collections.abc。为了减少加载时间,Python 3.4 在collections包之外实现这个模块(在 Lib/_collections_abc.py 中,https://hg.python.org/cpython/file/3.4/Lib/_collections_abc.py),因此要与collections分开导入。另一个abc模块就是abc(即 Lib/abc.py,https://hg.python.org/cpython/file/3.4/Lib/abc.py),这里定义的是abc.ABC类。每个抽象基类都依赖这个类,但是不用导入它,除非定义新抽象基类。
Python 3.4 在 collections.abc 模块中定义了 16 个抽象基类,简要的 UML 类图(没有属性名称)如图 11-3 所示。collections.abc 的官方文档中有个不错的表格(https://docs.python.org/3/library/collections.abc.html#collections-abstract-base-classes),对各个抽象基类做了总结,说明了相互之间的关系,以及各个基类提供的抽象方法和具体方法(称为“混入方法”)。图 11-3 中有很多多重继承。我们将在第 12 章着重说明多重继承,讨论抽象基类时通常不用考虑多重继承。6
6Java 认为多重继承有危害,因此没有提供支持,但是提供了接口:Java 的接口可以扩展多个接口,而且 Java 的类可以实现多个接口。

图 11-3:collections.abc 模块中各个抽象基类的 UML 类图
下面详述图 11-3 中那一群基类。
Iterable、Container 和 Sized
各个集合应该继承这三个抽象基类,或者至少实现兼容的协议。Iterable 通过 __iter__ 方法支持迭代,Container 通过 __contains__ 方法支持 in 运算符,Sized 通过 __len__ 方法支持 len() 函数。
Sequence、Mapping 和 Set
这三个是主要的不可变集合类型,而且各自都有可变的子类。MutableSequence 的详细类图见图 11-2;MutableMapping 和 MutableSet 的类图在第 3 章中(见图 3-1 和图 3-2)。
MappingView
在 Python 3 中,映射方法 .items()、.keys() 和 .values() 返回的对象分别是 ItemsView、KeysView 和 ValuesView 的实例。前两个类还从 Set 类继承了丰富的接口,包含 3.8.3 节所述的全部运算符。
Callable 和 Hashable
这两个抽象基类与集合没有太大的关系,只不过因为 collections.abc 是标准库中定义抽象基类的第一个模块,而它们又太重要了,因此才把它们放到 collections.abc 模块中。我从未见过 Callable 或 Hashable 的子类。这两个抽象基类的主要作用是为内置函数 isinstance 提供支持,以一种安全的方式判断对象能不能调用或散列。7
7若想检查是否能调用,可以使用内置的 callable() 函数;但是没有类似的 hashable() 函数,因此测试对象是否可散列,最好使用 isinstance(my_obj, Hashable)。
Iterator
注意它是 Iterable 的子类。我们将在第 14 章详细讨论。
继 collections.abc 之后,标准库中最有用的抽象基类包是 numbers。下面就来介绍。
numbers 包(https://docs.python.org/3/library/numbers.html)定义的是“数字塔”(即各个抽象基类的层次结构是线性的),其中 Number 是位于最顶端的超类,随后是 Complex 子类,依次往下,最底端是 Integral 类:
Number
Complex
Real
Rational
Integral
因此,如果想检查一个数是不是整数,可以使用 isinstance(x, numbers.Integral),这样代码就能接受 int、bool(int 的子类),或者外部库使用 numbers 抽象基类注册的其他类型。为了满足检查的需要,你或者你的 API 的用户始终可以把兼容的类型注册为 numbers.Integral 的虚拟子类。
与之类似,如果一个值可能是浮点数类型,可以使用 isinstance(x, numbers.Real) 检查。这样代码就能接受 bool、int、float、fractions.Fraction,或者外部库(如 NumPy,它做了相应的注册)提供的非复数类型。
![]()
decimal.Decimal没有注册为numbers.Real的虚拟子类,这有点奇怪。没注册的原因是,如果你的程序需要Decimal的精度,要防止与其他低精度数字类型混淆,尤其是浮点数。
了解一些现有的抽象基类之后,我们将从零开始实现一个抽象基类,然后实际使用,以此实践白鹅类型。这么做的目的不是鼓励每个人都立即开始定义抽象基类,而是教你怎么阅读标准库和其他包中的抽象基类源码。