广告位联系
返回顶部
分享到

python正则表达中的re库常用方法总结

python 来源:互联网 作者:佚名 发布时间:2022-08-29 21:24:09 人浏览
摘要

元字符: 预定义字符集: 我进行组合一些复杂的正则表达式的时候是为了快捷去晚上找一些现成的模式,然后再自己进行修改,变成符合自己需要的一些正则表达式。 1 2 3 4 5 6 7 8 9

元字符 :

预定义字符集:

我进行组合一些复杂的正则表达式的时候是为了快捷去晚上找一些现成的模式,然后再自己进行修改,变成符合自己需要的一些正则表达式。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

import re

  

# 正则表达式中的一些使用的符号

  

# 匹配出现符合条件的 0 次的或者是 多次

  

str1 = 'qwertyuio1ui3oo467j398k'

  

#  关键词: *    下面的句子就是进行匹配 零次 或者是 多次(多个字符) 符合是数字的意思

pattern = re.compile(r'\d*')

res = re.findall(pattern, str1)

print(res)

""""

显示的结果:

['', '', '', '', '', '', '', '', '', '1', '', '', '3', '', '', '467', '', '398', '', '']

"""

# 关键词: +  匹配一次或者是多次的结果

  

pattern = re.compile(r'\d+')

res = re.findall(pattern, str1)

print(res)

"""

显示结果:

['1', '3', '467', '398']

"""

  

# 关键词: ?  匹配0次或者是1次的结果

  

pattern = re.compile(r'\d?')

res = re.findall(pattern, str1)

print(res)

"""

['', '', '', '', '', '', '', '', '', '1',

'', '', '3', '', '', '4', '6', '7', '',

'3', '9', '8', '', '']

"""

 

# {m}精确匹配m次  (比如写进去的3,那么他就是匹配到是3个数字字符串的所有小字符串)

pattern = re.compile(r'\d{3}')

res = re.findall(pattern, str1)

print(res)

# 结果:['467', '398']

  

# {m, n} 最少匹配m次,最多匹配n次

# 记住在{}里面是不能随便加上空格的?

pattern = re.compile(r'\d{1,3}')

res = re.findall(pattern, str1)

print(res)

# 结果:['1', '3', '467', '398']

match()函数只检测 目标字符(串) 是不是在string的开始位置匹配,search()会扫描整个string查找匹配, match()只有在0位置匹配成功才会有返回,如果不是开始位置匹配成功,match()就会返回None

代码解释:

import re

m = re.match('lsp','hhttlsp')

if m is not None: 

        print(m.group())

else:

        print('noneFine')

显示结果:

noneFine

n = re.search('lsp','hhttlsp')

if n is not None:

        print(n.group())

else:

        print(noneFine')

显示结果:

lsp

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

import re

n = re.search('lsp','hhttlsp')

if n:

    print(n.group())

else:

    print('noneFine')

# 显示结果:

# lsp

m = re.match('lsp','hhttlsp')

if m:

    print(m.group())

else:

    print('noneFine')

# 显示结果:

# noneFine

python的re库有两个函数/方法用于实现搜索和替换功能: sub()和subn().两者几乎一样,都是将某字符串中所有匹配正则表达式的部分进行某种形式的替换.用来替换的部分通常是一个字符串,但它也可能是一个函数,该函数返回一个用来替换的字符串.subn()和 sub()一样,但subn()还返回一个表示替换的总数,替换后的字符串和表示替换总数的数字一起作为一个拥有两个元素的元组返回.

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

# 可以使用sub()方法来进行查询和替换,sub方法的格式为:

# sub(replacement, string[, count=0])

# replacement是被替换成的文本

# string是需要被替换的文本

# count是一个可选参数,指最大被替换的数量

  

# 下面进行将所有的数字给进行替换掉

pattern = re.compile(r'\d')

res = re.sub(pattern, '替换掉的数字  ',str1)

print(res)

# 下文结果,为了方便大家看到换了多少个数字,我使用了换行将字符串给换行看出有几次换了数字

"""

qwertyuio替换掉的数字 

ui替换掉的数字 

oo替换掉的数字 

替换掉的数字 

替换掉的数字 

j替换掉的数字 

替换掉的数字 

替换掉的数字  k

"""

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

# 加上显示修改了多少次

res = re.subn(pattern, '替换掉的数字  ',str1)

print(res)

"""

结果:

('qwertyuio替换掉的数字

 ui替换掉的数字 

 oo替换掉的数字

  替换掉的数字

   替换掉的数字 

   j替换掉的数字 

   替换掉的数字

    替换掉的数字 

    k', 8)

"""

re.split(pattern, string, maxsplit=0, flags=0),如果匹配成功,则返回一个列表,否则返回原string列表;

  • 第1个参数:正则表达式
  • 第2个参数:要匹配查找的原始字符串;
  • 第3个参数:可选参数,表示最大的拆分次数,默认为0,表示全部分割;
  • 第4个参数:可选参数,标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等;

特别注意: 此方法并不是完全匹配。它仅仅决定在字符串开始的位置是否匹配。所以当pattern结束时若还有剩余字符,仍然成功。若想进行完全匹配,可以在表达式末尾加上边界匹配符'$'

1

2

3

4

5

6

str2 = '自然语言处理123机器学习456深度学习'

pattern = re.compile(r'\d+')

res = re.split(pattern, str2)

print(res)

# 结果:

# ['自然语言处理', '机器学习', '深度学习']

Python的re模块是第一个提出解决方案的模块:命名捕获组和命名后向引用。(?P <name> group)将组的匹配捕获到后向引用“名称”中。

1

2

3

4

5

6

str2 = '自然语言处理123机器学习456深度学习'

pattern = re.compile(r'(?P<dota>\d+)(?P<lsp>\D+)')

m = re.search(pattern, str2)

print(m.group('lsp'))

# 结果为:

# 机器学习

1

2

3

4

5

6

str2 = '自然语言处理123机器学习456深度学习'

pattern = re.compile(r'(?P<dota>\d+)(?P<lsp>\D+)')

m = re.search(pattern, str2)

print(m.group('dota'))

# 结果为:

# 123

进行号码的筛选,小尝试:

1

2

3

4

5

6

7

# 筛选号码

str3 = 'number  132-3209-*******'

pattern = re.compile(r'(\d\d\d-\d\d)')

res = re.search(pattern, str3)

print(res.group())

# 显示结果:

# 132-32

全部代码:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

# -*- coding:utf-8 -*-

# @Author : DaFuChen

# @File : demo1.py

# @software: PyCharm

 

import re

  

# 正则表达式中的一些使用的符号

  

# 匹配出现符合条件的 0 次的或者是 多次

  

str1 = 'qwertyuio1ui3oo467j398k'

  

#  关键词: *    下面的句子就是进行匹配 零次 或者是 多次(多个字符) 符合是数字的意思

pattern = re.compile(r'\d*')

res = re.findall(pattern, str1)

print(res)

""""

显示的结果:

['', '', '', '', '', '', '', '', '', '1', '', '', '3', '', '', '467', '', '398', '', '']

"""

  

# 关键词: +  匹配一次或者是多次的结果

  

pattern = re.compile(r'\d+')

res = re.findall(pattern, str1)

print(res)

"""

显示结果:

['1', '3', '467', '398']

"""

  

# 关键词: ?  匹配0次或者是1次的结果

  

pattern = re.compile(r'\d?')

res = re.findall(pattern, str1)

print(res)

"""

['', '', '', '', '', '', '', '', '', '1',

'', '', '3', '', '', '4', '6', '7', '',

'3', '9', '8', '', '']

"""

# {m}精确匹配m次  (比如写进去的3,那么他就是匹配到是3个数字字符串的所有小字符串)

pattern = re.compile(r'\d{3}')

res = re.findall(pattern, str1)

print(res)

# 结果:['467', '398']

  

# {m, n} 最少匹配m次,最多匹配n次

# 记住在{}里面是不能随便加上空格的?

pattern = re.compile(r'\d{1,3}')

res = re.findall(pattern, str1)

print(res)

# 结果:['1', '3', '467', '398']

  

import re

  

n = re.search('lsp','hhttlsp')

if n:

    print(n.group())

else:

    print('noneFine')

# 显示结果:

# lsp

  

m = re.match('lsp','hhttlsp')

if m:

    print(m.group())

else:

    print('noneFine')

# 显示结果:

# noneFine

  

# 可以使用sub()方法来进行查询和替换,sub方法的格式为:

# sub(replacement, string[, count=0])

# replacement是被替换成的文本

# string是需要被替换的文本

# count是一个可选参数,指最大被替换的数量

  

# 下面进行将所有的数字给进行替换掉

pattern = re.compile(r'\d')

res = re.sub(pattern, '替换掉的数字  ',str1)

print(res)

# 下文结果,为了方便大家看到换了多少个数字,我使用了换行将字符串给换行看出有几次换了数字

"""

qwertyuio替换掉的数字 

ui替换掉的数字 

oo替换掉的数字 

替换掉的数字 

替换掉的数字 

j替换掉的数字 

替换掉的数字 

替换掉的数字  k

"""

  

# 加上显示修改了多少次

res = re.subn(pattern, '替换掉的数字  ',str1)

print(res)

"""

结果:

('qwertyuio替换掉的数字

 ui替换掉的数字 

 oo替换掉的数字

  替换掉的数字

   替换掉的数字 

   j替换掉的数字 

   替换掉的数字

    替换掉的数字 

    k', 8)

"""

str2 = '自然语言处理123机器学习456深度学习'

pattern = re.compile(r'\d+')

res = re.split(pattern, str2)

print(res)

# 结果:

# ['自然语言处理', '机器学习', '深度学习']

str2 = '自然语言处理123机器学习456深度学习'

pattern = re.compile(r'(?P<dota>\d+)(?P<lsp>\D+)')

m = re.search(pattern, str2)

print(m.group('dota'))

# 结果为:

# 123

  

# 筛选号码

str3 = 'number  132-3209-*******'

pattern = re.compile(r'(\d\d\d-\d\d)')

res = re.search(pattern, str3)

print(res.group())

# 显示结果:

# 132-32


版权声明 : 本文内容来源于互联网或用户自行发布贡献,该文观点仅代表原作者本人。本站仅提供信息存储空间服务和不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权, 违法违规的内容, 请发送邮件至2530232025#qq.cn(#换@)举报,一经查实,本站将立刻删除。
原文链接 : https://blog.csdn.net/blockshowtouse/article/details/126573110
相关文章
  • Python Django教程之实现新闻应用程序

    Python Django教程之实现新闻应用程序
    Django是一个用Python编写的高级框架,它允许我们创建服务器端Web应用程序。在本文中,我们将了解如何使用Django创建新闻应用程序。 我们将
  • 书写Python代码的一种更优雅方式(推荐!)

    书写Python代码的一种更优雅方式(推荐!)
    一些比较熟悉pandas的读者朋友应该经常会使用query()、eval()、pipe()、assign()等pandas的常用方法,书写可读性很高的「链式」数据分析处理代码
  • Python灰度变换中伽马变换分析实现

    Python灰度变换中伽马变换分析实现
    1. 介绍 伽马变换主要目的是对比度拉伸,将图像灰度较低的部分进行修正 伽马变换针对的是对单个像素点的变换,也就是点对点的映射 形
  • 使用OpenCV实现迷宫解密的全过程

    使用OpenCV实现迷宫解密的全过程
    一、你能自己走出迷宫吗? 如下图所示,可以看到是一张较为复杂的迷宫图,相信也有人尝试过自己一点一点的找出口,但我们肉眼来解谜
  • Python中的数据精度问题的介绍

    Python中的数据精度问题的介绍
    一、python运算时精度问题 1.运行时精度问题 在Python中(其他语言中也存在这个问题,这是计算机采用二进制导致的),有时候由于二进制和
  • Python随机值生成的常用方法

    Python随机值生成的常用方法
    一、随机整数 1.包含上下限:[a, b] 1 2 3 4 import random #1、随机整数:包含上下限:[a, b] for i in range(10): print(random.randint(0,5),end= | ) 查看运行结
  • Python字典高级用法深入分析讲解
    一、 collections 中 defaultdict 的使用 1.字典的键映射多个值 将下面的列表转成字典 l = [(a,2),(b,3),(a,1),(b,4),(a,3),(a,1),(b,3)] 一个字典就是一个键对
  • Python浅析多态与鸭子类型使用实例
    什么多态:同一事物有多种形态 为何要有多态=》多态会带来什么样的特性,多态性 多态性指的是可以在不考虑对象具体类型的情况下而直
  • Python字典高级用法深入分析介绍
    一、 collections 中 defaultdict 的使用 1.字典的键映射多个值 将下面的列表转成字典 l = [(a,2),(b,3),(a,1),(b,4),(a,3),(a,1),(b,3)] 一个字典就是一个键对
  • Python淘宝或京东等秒杀抢购脚本实现(秒杀脚本

    Python淘宝或京东等秒杀抢购脚本实现(秒杀脚本
    我们的目标是秒杀淘宝或京东等的订单,这里面有几个关键点,首先需要登录淘宝或京东,其次你需要准备好订单,最后要在指定时间快速
  • 本站所有内容来源于互联网或用户自行发布,本站仅提供信息存储空间服务,不拥有版权,不承担法律责任。如有侵犯您的权益,请您联系站长处理!
  • Copyright © 2017-2022 F11.CN All Rights Reserved. F11站长开发者网 版权所有 | 苏ICP备2022031554号-1 | 51LA统计