Python数据类型之“集合(Sets)与映射(Mapping)”

一、集合类型(Sets)

集合对象是不同的(不可重复)hashable对象的无序集合。常见用法包括:成员关系测试、移除序列中的重复、以及科学计算,例如交集、并集、差分和对称差分。通俗点来说,集合是一个无序不重复元素的数据集,其基本功能是进行成员关系测试和消除重复元素。

目前有两种内置的集合类型:set 和 frozenset。set类型是可变的--可以使用add() 和 remove()等方法更改其内容。由于它是可变的,它没有hash值,因此它不能被当做字典的键值或另一集合的元素。frozenset类型是不可变的 和 hashable的,它的内容不能再创建后改变,因此它可以用作字典的键值或作为另一个集合的元素。

set类构建函数 class set([iterable]) class frozenset([iterable]) set的构建方式

将一个用逗号分割的元素列表放在一堆花括号内可以创建一个非空set集合,如{'Tom', 'Jerry', 'Peter'}

给set的构建函数传递一个空值将会创建一个空set集合(注意:{}表示的是一个空字典而不是空set集合)

给set的构架你函数传一个非空iterable参数将会创建一个非空set集合

注意:

再次强调,一个set集合内的元素必须是hashable的(不可变的)。要想表示一个set的set,那么内部的set必须是frozenset对象,因为frozenset是不可变的,是hashable的。

set构建示例 >>> {'Tom', 'Jerry', 'Peter'} # 使用花括号创建非空set集合 {'Jerry', 'Tom', 'Peter'} >>> set() # 使用set构建函数创建空set集合 set() >>> set((1, 2, 3 ,4)) # 使用set构建函数创建非空set集合 {1, 2, 3, 4} >>> set((1, 2, 3 ,['a', 'b', 'c'])) # set集合中的元素必须是不可变的、可哈希的 Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: unhashable type: 'list' set 和 frozenset都支持的操作

作为无序集合,set不记录元素位置或插入顺序。因此set不支持索引、切片或其他类序列行为。

len(set) # 获取集合中的条目个数 x in set # 成员关系测试--包含 x not in set # 成员关系测试--不包含 for x in set # 循环遍历集合中的条目 isdisjoint(other) # 判断该集合是否与另外一个集合不相交(当且仅当交集为空),不相交则返回True issubset(other) 或 set <= other # 判断该集合是否是另外一个集合的子集 set < other # 判断该集合是否是另外一个集合的真子集 issuperset(other) 或 set >= other # 判断该集合是否是另外一个集合的父集 set > other # 判断该集合是否是另外一个集合的真父集 union(other,...) 或 set | other | ... # 求该集合与另外一个或多个集合的并集 intersection(other,...) 或 set & other & ... # 求该集合与另外一个或多个集合的交集 difference(other,...) 或 set - other - ... # 求该集合与另外一个或多个集合的差集(该集合中存在但其它集合中不存在的元素集合) symmetric_difference(other) 或 set ^ other # 求该集合与另外一个集合的对称差集(该集合中存在但另一集合中不存在,或另一集合中存在但该集合中不存在的元素集合) copy() # 返回一个新的浅拷贝集合

说明:

a) union()、intersection()、differnce()、symmetric_difference()、issubset() 和 issuperset()方法的可接受任何可迭对象作为参数。相比之下,它们的基于运算符的相应操作需要它们的参数是set。这避免了像set('abc') & 'cbs'这样易出错的结构,有利于更易读的结构,如set('abc').intersection('cbs')。

>>> set('abc') {'c', 'a', 'b'} >>> set('abc') & 'cbs' # 使用操作符进行相关操作,操作符两边都必须是set类型 Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: unsupported operand type(s) for &: 'set' and 'str' >>> set('abc') & set('cbs') {'c', 'b'} >>> set('abc').intersection('cbs') # 调用方法进行相关操作,参数可以是任意可迭代对象 {'c', 'b'} >>> set('abc').intersection(['c','s', 'b']) {'c', 'b'}

b) set和frozenset支持 集合与集合进行比较操作。

当且仅当每个集合的每个元素都包含在另一个(每个集合都是另一个的子集)时,两个集合是相等的;

当且仅当第一集合是第二集合的真子集(是子集,但不相等)时,集合小于另一集合;

当且仅当第一集合是第二集合的真父集(是父集,但不相等)时,集合大于另一集合;

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/e45a64f9149f9f2fb357c2b6a014bf64.html