python
主页 > 脚本 > python >

Python学习之集合的常用方法介绍

2022-03-05 | 秩名 | 点击:

什么是集合?

集合并不是一种数据处理类型,而是一种中间类型。

集合中所有的元素放在 {} 中间,并用逗号分开,例如:

{1, 2, 3},一个包含 3 个整数的列表

{‘a’, ‘b’, ‘c’},一个包含 3 个字符串的列表

集合与列表的区别

功能 列表 集合
顺序 有序 无序
内容 可重复 不可重复
功能 用于数据的使用 用于数据的交集、并集、差集的获取
索引 有索引 无索引
符号 [ ] —> [1, 2, 3] { } —> {1, 2, 3}

集合的创建方法

通过 set 函数创建集合,也可以使用有值的大括号来创建。 如 {1, 2} ,但不能使用空的大括号来创建。(空的大括号是一个空的字典)

示例如下:

1

2

3

4

5

6

7

8

9

test_set_01 = set()             # ---> 一个空的集合

test_set_02 = set([1, 2, 3])    # ---> 传入列表或元组

test_set_03 = {1, 2, 3}         # ---> 传入元素

test_set_04 = {}                # ---> 这样的方式是错误的,这是一个空的字典

 

print(type(test_set_04))

 

# 执行结果如下:

# ---> <class 'dict'>

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

test_list_01 = ['name', 'age', 'birthday']

test_set_01 = set(test_list_01)

print(test_set_01)

 

# 执行结果如下:

# >>> {'name', 'age', 'birthday'}      可以看到,传入的并不是列表,而是列表的元素

 

 

test_list_02 = ['name', 'age', 'birthday', 'age']

test_set_02 = set(test_list_02)

print(test_set_02)

 

# 执行结果如下:

# >>> {'name', 'age', 'birthday'}      可以看到,列表里重复的元素,做了去重的处理

 

 

test_list_03 = (1, 2, 3, 1, 5)

test_set_03 = set(test_list_03)

print(test_set_03)

 

# 执行结果如下:

# >>> {1, 2, 3, 5}                     可以看到,元组里重复的元素,做了去重的处理

 

 

test_set_04 = {['name', 'age', 'birthday']}

print(test_set_04)

 

# 执行结果如下:

# >>> TypeError: unhashable type: 'list'   集合内不可传入列表,否则会报错

 

 

test_set_05 = {{'name', 'age', 'birthday'}}

print(test_set_05)

 

# 执行结果如下:

# >>> TypeError: unhashable type: 'set'    集合内同样也不可传入字典

 

 

test_set_06 = {'name', 1, 3.14, (666, 888)}

print(test_set_06)

 

# 执行结果如下:

# >>> {'name', 3.14, 1, (666, 888)}            集合内可以传入不同的数据类型(列表不可以直接传入)

集合的增删改

add 函数

add 函数的功能:用于集合中添加一个元素,如果集合中已经存在该被添加的元素,则该函数不执行。

add 函数的用法:set.add(item) ;item 为要被添加到集合的元素;无返回值。

示例如下:

1

2

3

4

5

6

7

test_set = {'name', 'age', 'birthday'}

test_set.add('sex')

test_set.add('name')

print(test_set)

 

# 执行结果如下:

# >>> {'sex', 'birthday', 'age', 'name'}   已存在的 'name' 元素,未再次执行添加

update 函数

update 函数的功能:在集合中加入一个新的集合(或者列表、元组、字符串),如果新集合内的元素在原集合中存在则无视。

update 函数的用法:set.update(iterable) ;iterable为集合、列表、元组、字符串;无返回值,直接作用于原集合。

示例如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

test_set = set()

test_list = ['name', 'age', 'birthday']

test_set.update(test_list)

print(test_set)

 

# 执行结果如下:

# >>> {'birthday', 'age', 'name'}      列表的成员(元素)被添加进集合

 

 

test_tuple = (666, 888)

test_set.update(test_tuple)

print(test_set)

 

# 执行结果如下:

# >>> {'name', 'birthday', 'age', 888, 666}        元组的成员(元素)被添加进集合

 

 

name = 'Neo'

test_set.update(name)

print(test_set)

 

# 执行结果如下:

# >>> {'name', 'N', 'birthday', 'e', 'age', 'o', 888, 666}     字符串是每个字符都作为元素被添加进集合的

remove 函数

remove函数的功能:将集合中某个元素删除,如果该元素不存在则会报错。

remove函数的用法:set.remove(item) ;item 为当前集合中的一个元素;无返回值,直接作用于原集合。

需要注意的是,item 为集合中的某一个元素,而不是索引。

示例如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

test_set = set()

test_list = ['name', 'age', 'birthday']

test_set.update(test_list)

print(test_set)

 

# 执行结果如下:

# >>> {'name', 'birthday', 'age'}

 

 

test_set.remove('age')

print(test_set)

 

# 执行结果如下:

# >>> {'birthday', 'name'}

 

 

test_set_01 = set()

test_set.remove('test')

print(test_set_01)

 

# 执行结果如下:

# >>> KeyError: 'test'     'test'元素不存在则报错。

clear 函数

clear 函数的功能:清空当前集合中所有的元素

clear 函数的用法:set.clear() ;无返回值,直接作用于原集合。

示例如下:

1

2

3

4

5

6

7

8

test_set = set()

test_list = ['name', 'age', 'birthday']

test_set.clear()

 

print(test_set)

 

# 执行结果如下:

# >>> set()

del 方法删除集合

del 的功能:直接删除 (作用于集合,无法通过索引删除)

示例如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

test_set = set()

test_list = ['name', 'age', 'birthday']

test_set.update(test_list)

print(test_set)

 

# 执行结果如下:

# >>> {'birthday', 'age', 'name'}

 

del test_set

print(test_set)

 

# 执行结果如下:

# >>> NameError: name 'test_set' is not defined.

关于集合的重要说明

获取两个集合交、并、差集的函数

difference() 函数

什么是差集:

a 和 b 两个集合,由所属于 a 且不属于 b 的元素组成的集合叫做 a 集合 与 b 集合 的差集。

difference() 函数的功能:返回集合的差集,即返回的集合元素包含在第一个集合中,但不包含在第二个集合中。

difference() 函数的用法:a_set.difference(b_set) ;b_set 为当前集合需要比对的集合;返回值为原集合作用于对比集合的差集。(即 a_set 与 b_set 的差集)

示例如下:

1

2

3

4

5

6

7

8

names_set_01 = {'Neo', 'Lily', 'Jack'}

names_set_02 = {'Jack', 'Adem', 'Albina'}

names_diff = names_set_01.difference(names_set_02)

 

print(names_diff)

 

# 执行结果如下:

# >>> {'Lily', 'Neo'}

intersection() 函数

什么是交集?

a 和 b 两个集合,分别拥有相同的元素集,称之为 a 集合 与 b 集合 的交集。

intersection() 函数的功能:返回两个或者更多个集合中都包含有的元素。(即交集)

intersection() 函数的用法:a_set.inersection(b_set...) ;b_set… 为当前集合需要比对的一个或者多个集合;返回值为原集合作用于对比集合的交集。

示例如下:

1

2

3

4

5

6

7

8

9

names_set_01 = {'Neo', 'Lily', 'Jack', 'Adem'}

names_set_02 = {'Jack', 'Adem', 'Albina'}

names_set_03 = {'Apollo', 'Ben', 'Adem'}

names_inter = names_set_01.intersection(names_set_02, names_set_03)

 

print(names_inter)

 

# 执行结果如下:

# >>> {'Adem'}

union() 函数

什么是并集?

a 和 b 两个集合中所有的元素(去掉重复的),即为 a 集合 与 b 集合 的并集。

union() 函数的功能:返回多个集合的并集,即包含了所有集合的元素(重复的元素,只出现一次)

union() 函数的用法:a_set.union(b_set...) ;b_set… 为当前集合需要比对的一个或者多个集合;返回值为原集合作用于对比集合的并集。

示例如下:

1

2

3

4

5

6

7

8

9

names_set_01 = {'Neo', 'Lily', 'Jack', 'Adem'}

names_set_02 = {'Jack', 'Adem', 'Albina'}

names_set_03 = {'Apollo', 'Ben', 'Adem'}

names_union = names_set_01.union(names_set_02, names_set_03)

 

print(names_union)

 

# 执行结果如下:

# >>> {'Lily', 'Neo', 'Albina', 'Apollo', 'Jack', 'Ben', 'Adem'}

判断两个集合中是否存在相同的元素

isdisjoint() 函数

isdisjoint()函数的功能:判断两个集合是否包含相同的元素,如果没有返回 True , 否则就返回 False

isdisjoint()函数的用法:a_set.isdisjoint(b_set) ;b_set 为与当前集合用来判断的集合;返回值为布尔值

示例如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

names_set_01 = {'Neo', 'Lily', 'Jack', 'Adem'}

names_set_02 = {'Jack', 'Adem', 'Albina'}

names_isdisjoint = names_set_01.isdisjoint(names_set_02)

print(names_isdisjoint)

 

# 执行结果如下:

# >>> False

 

names_set_01 = {'Neo', 'Lily', 'Jack'}

names_set_02 = {'Ben', 'Adem', 'Albina'}

names_isdisjoint = names_set_01.isdisjoint(names_set_02)

print(names_isdisjoint)

 

# 执行结果如下:

# >>> True

拓展 - 集合的 ‘&、|、- 运算符’

& 符可以计算两个集合的交集,与集合的intersection()函数实现的功能一样

| 符可以计算两个集合的并集,与集合的union()函数实现的功能一样

- 运算符可以计算两个集合的差集,与集合的difference()函数实现的功能一样

代码示例如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

# 交集

names_set_01 = {'Neo', 'Lily', 'Jack', 'Adem'}

names_set_02 = {'Jack', 'Adem', 'Albina'}

names_set_03 = {'Apollo', 'Ben', 'Adem'}

names_inter = names_set_01.intersection(names_set_02, names_set_03)

names_inter_01 = names_set_01 & names_set_02 & names_set_03

 

print(names_inter)

print(names_inter_01)

 

# 执行结果如下:

# >>> {'Adem'}

# >>> {'Adem'}

1

2

3

4

5

6

7

8

9

10

11

12

# 差集

names_set_01 = {'Neo', 'Lily', 'Jack'}

names_set_02 = {'Jack', 'Adem', 'Albina'}

names_diff = names_set_01.difference(names_set_02)

names_diff_01 = names_set_01 - names_set_02

 

print(names_diff)

print(names_diff_01)

 

# 执行结果如下:

# >>> {'Lily', 'Neo'}

# >>> {'Lily', 'Neo'}

1

2

3

4

5

6

7

8

9

10

11

12

13

# 并集

names_set_01 = {'Neo', 'Lily', 'Jack', 'Adem'}

names_set_02 = {'Jack', 'Adem', 'Albina'}

names_set_03 = {'Apollo', 'Ben', 'Adem'}

names_union = names_set_01.union(names_set_02, names_set_03)

names_union_1 = names_set_01 | names_set_02 | names_set_03

 

print(names_union)

print(names_union_1)

 

# 执行结果如下:

# >>> {'Adem', 'Albina', 'Neo', 'Jack', 'Lily', 'Ben', 'Apollo'}

# >>> {'Adem', 'Albina', 'Neo', 'Jack', 'Lily', 'Ben', 'Apollo'}

&、|、- 与 intersection()、union()、difference()函数的不同之处

集合运算时:

intersection()、union()、difference()函数的参数可以是集合,也可以是列表或字典、字符串。

&、|、-运算符左右两边必须是集合。

原文链接:https://blog.csdn.net/weixin_42250835/article/details/123243357
相关文章
最新更新