mysql 01 Python进阶：正则表达式

re.match函数

使用 Python 中的 re 模块时，可以通过 re.match() 函数来尝试从字符串的开头匹配一个模式。以下是一个简单的详解和举例：

import re

# 定义一个正则表达式模式

pattern = r'^[a-z]+' # 匹配开头的小写字母序列

# 要匹配的字符串

text = "hello world"

# 使用 re.match() 尝试匹配模式

match_obj = re.match(pattern, text)

if match_obj:

print("匹配成功:", match_obj.group())

else:

print("无匹配结果")

在这个示例中，我们使用了 re.match() 函数来尝试从字符串的开头匹配一个小写字母序列。让我们具体解释一下：

r'^[a-z]+'：这是一个正则表达式模式，包含了以下几个部分：

^ 表示匹配字符串的开头。[a-z] 表示匹配任意一个小写字母。+ 表示匹配前面的模式一次或多次。 "hello world"：这是我们要进行匹配的字符串。 re.match(pattern, text)：使用 re.match() 函数尝试从字符串开头匹配指定的模式。 match_obj：re.match() 函数返回一个 Match 对象，如果匹配成功则包含匹配的结果，否则为 None。 match_obj.group()：如果匹配成功，可以通过 match_obj.group() 方法获取匹配的内容。

在这个示例中，由于 “hello” 符合模式 r'^[a-z]+'，因此匹配成功，输出 “匹配成功: hello”。

re.search方法

可以通过 re.search() 函数来搜索整个字符串，尝试找到与指定模式匹配的子串。以下是一个详细解释和示例：

import re

# 定义一个正则表达式模式

pattern = r'world' # 要匹配的模式是 "world"

# 要搜索的字符串

text = "hello world"

# 使用 re.search() 方法在整个字符串中搜索模式

search_obj = re.search(pattern, text)

if search_obj:

print("找到匹配:", search_obj.group())

else:

print("未找到匹配")

在这个示例中，我们使用了 re.search() 函数来搜索整个字符串，尝试找到子串 “world”。以下是每个部分的详细解释：

r'world'：这是一个简单的正则表达式模式，它表示要匹配的字符串是 “world”。"hello world"：这是我们要进行搜索的字符串。re.search(pattern, text)：使用 re.search() 函数在整个字符串中搜索指定的模式。search_obj：re.search() 函数返回一个 Match 对象，如果找到了匹配的子串，Match 对象就会包含匹配的结果，否则为 None。search_obj.group()：如果找到了匹配的子串，可以通过调用 match_obj.group() 方法来获取匹配的内容。

在这个示例中，由于字符串 “world” 存在于 “hello world” 中，因此 re.search() 函数找到了匹配，输出 “找到匹配: world”。

re.search() 是一个非常有用的函数，可以帮助您在字符串中查找特定的模式。希望这个示例能够帮助您理解 re.search() 函数的使用方法。

re.match 与 re.search的区别

re.match() 和 re.search() 是 Python 中 re 模块中用于正则表达式匹配的两个函数，它们之间有以下区别：

re.match()：

re.match() 函数尝试从字符串的开头开始匹配模式。如果字符串开头不符合模式，则匹配失败，返回 None。如果字符串开始部分与模式匹配，返回一个 Match 对象，可以通过 group() 方法获取匹配的内容。 re.search()：

re.search() 函数在整个字符串中搜索并找到第一个符合模式的子串。不要求字符串从开头开始匹配，只要找到一个符合模式的子串就返回。返回第一个匹配到的结果，也是一个 Match 对象，可以通过 group() 方法获取匹配的内容。

举例来说，假设有字符串 “hello world”，并使用以下两个正则表达式模式进行匹配：

模式为 r'world'：

re.match() 将会匹配失败，因为 “hello” 不符合该模式，返回 None。re.search() 将会匹配成功，在 “world” 中找到了符合的子串，返回 “world”。模式为 r'hello'：

re.match() 将会匹配成功，因为 “hello” 符合该模式，返回 “hello”。re.search() 将会匹配成功，在 “hello world” 中找到了符合的子串，返回 “hello”。

re.match() 适用于需要从字符串开头处进行匹配的场景，而 re.search() 则适用于需要在整个字符串中查找符合模式的子串的场景。根据具体的需求选择使用不同的函数能够更有效地实现匹配目的。

检索和替换

在Python中，您可以使用re模块来进行文本的检索和替换。下面是一个简单的例子来说明如何使用re模块进行检索和替换：

import re

# 要操作的字符串

text = "The cat and the hat sat on the mat."

# 定义要搜索的模式

pattern = r'cat'

# 使用re.sub()进行替换

new_text = re.sub(pattern, 'dog', text)

print(new_text)

在上面的示例中，我们使用了re.sub()函数来将文本中所有匹配模式r’cat’的部分替换为’dog’。执行上述代码后，输出结果为：“The dog and the hat sat on the mat.”。

另外，如果想要查找所有匹配的子串，并对其进行特定处理，也可以使用re.findall()和re.finditer()函数来实现。这两个函数可以用于找到所有匹配的子串，并返回它们的位置或者进行进一步的处理。

repl 参数是一个函数

是的，re 模块中的 re.sub() 函数允许使用一个函数作为 repl 参数，以便对每个匹配的子串进行更复杂的替换操作。下面是一个示例，演示了如何使用函数作为 repl 参数：

import re

# 要操作的字符串

text = "The cat and the hat sat on the mat."

# 定义替换函数

def repl\_function(match_obj):

word = match_obj.group()

if word == 'cat':

return 'dog'

elif word == 'hat':

return 'rug'

else:

return '\*\*\*'

# 使用re.sub()并将函数作为repl参数

new_text = re.sub(r'\b(cat|hat)\b', repl_function, text)

print(new_text)

在这个示例中，我们定义了一个名为 repl_function 的函数，该函数接收一个 Match 对象作为输入，并根据匹配到的子串来决定如何进行替换。然后，我们使用 re.sub() 函数，将这个函数作为 repl 参数传递给它。执行上述代码后，输出结果为：“The dog and the rug sat on the mat.”。

函数作为 repl 参数的用法，可以让你对每个匹配到的子串进行更加灵活和复杂的处理，从而进行更加精细的替换操作。

compile 函数

在 Python 中，re 模块提供了 compile() 函数，用于将正则表达式编译为一个对象，以便在之后的匹配中复用。这种预编译的方式可以提高匹配效率，特别是在需要多次使用同一模式进行匹配时。下面是一个简单的示例来说明 compile() 函数的使用：

import re

# 将正则表达式编译为对象

pattern = re.compile(r'hello')

# 要匹配的字符串

text = "hello world"

# 使用编译后的对象进行匹配

match_obj = pattern.search(text)

if match_obj:

print("找到匹配:", match_obj.group())

else:

print("未找到匹配")

在上述示例中，我们首先使用 re.compile() 函数将正则表达式模式 r’hello’ 编译为一个模式对象 pattern，然后在之后的代码中可以重复使用这个 pattern 对象进行匹配操作。

使用 compile() 函数的优点包括提高匹配效率和可以提前检查正则表达式的有效性（如果有语法错误，会在编译阶段就抛出异常）。

re.compile() 函数允许您事先编译好正则表达式模式，并得到一个可重复使用的模式对象，为之后的匹配操作提供了便利和性能上的提升。

findall

在 Python 的 re 模块中，re.findall() 函数用于在给定的字符串中查找所有匹配指定模式的子串，并以列表的形式返回这些子串。下面是一个简单的示例来说明 re.findall() 函数的使用：

import re

# 要匹配的字符串

text = "The cat and the hat sat on the mat."

# 使用 re.findall() 查找所有匹配的子串

matches = re.findall(r'\b\w{3}\b', text)

print(matches)

使用了 re.findall() 函数来搜索字符串中所有匹配特定模式的子串。具体来说，我们使用的模式是 \b\w{3}\b，表示匹配长度为 3 的单词。

执行这段代码后，将输出结果作为一个列表：['The', 'cat', 'the', 'hat', 'sat', 'the', 'mat']，其中包含所有匹配到的长度为3的单词。

re.findall() 函数非常适合在不需要对每个匹配结果做更复杂处理的情况下，快速地获取所有匹配到的子串。当需要获取文本中所有符合特定模式的部分时，这个函数非常实用。

re.finditer

re.finditer() 函数与 re.findall() 类似，但它返回一个迭代器（iterator），该迭代器生成匹配的模式在字符串中的每一次出现。下面是一个简单的示例来说明 re.finditer() 函数的使用：

import re

# 要匹配的字符串

text = "The cat and the hat sat on the mat."

# 使用 re.finditer() 查找所有匹配的子串

matches = re.finditer(r'\b\w{3}\b', text)

for match in matches:

print(match.group(), match.start(), match.end())

在这个示例中，我们使用了 re.finditer() 函数来搜索字符串中所有匹配特定模式的子串。具体来说，我们使用的模式是 \b\w{3}\b，表示匹配长度为 3 的单词。

使用 re.finditer() 返回的迭代器，我们可以迭代处理每次匹配到的结果，从中获取匹配子串的内容以及其在原始文本中的起始和结束位置。执行上述代码后, 将输出每个匹配子串的内容以及起始和结束索引位置。

因此，re.finditer() 是一个非常有用的函数，特别适用于需要对每个匹配结果做更复杂处理的情况，或者在需要获取匹配子串的位置信息时。自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数Python工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年Python开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上前端开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新

如果你觉得这些内容对你有帮助，可以扫码获取！！！（备注Python）

296f86381401c05e862fe4e9.png)

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上前端开发知识点，真正体系化！

如果你觉得这些内容对你有帮助，可以扫码获取！！！（备注Python）

参考文章

评论可见，请评论后查看内容，谢谢！！！评论后请刷新页面。

夸智网

mysql 01 Python进阶：正则表达式

javascript 零基础学习JS--基础篇--正则表达式

unix 服务器 Java正则表达式，超详细整理，适合新手入门

发表评论取消回复

夸智网

mysql 01 Python进阶：正则表达式

javascript 零基础学习JS--基础篇--正则表达式

unix 服务器 Java正则表达式，超详细整理，适合新手入门

相关文章

发表评论取消回复