Python的正则规则举例分析-快上网网站建设公司

Python的正则规则举例分析

这篇文章主要讲解了“Python的正则规则举例分析”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“Python的正则规则举例分析”吧！

创新互联是一家集网站建设,英山企业网站建设,英山品牌网站建设,网站定制,英山网站建设报价,网络营销,网络优化,英山网站推广为一体的创新建站企业，帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿，时刻以成就客户成长自我，坚持不断学习、思考、沉淀、净化自己，让我们为更多的企业打造出实用型网站。

问题复现

我们都知道，Python有个正则规则\w，几乎所有的网上博客文章都告诉你，这个规则匹配字母数字及下划线，但实际并不是这样：

有Python2代码如下：

~|⇒ pythonPython 2.7.10 (default, Aug 17 2018, 19:45:58)
[GCC 4.2.1 Compatible Apple LLVM 10.0.0 (clang-1000.0.42)] on darwinType "help", "copyright", "credits" or "license" for more information.>>> import re>>> aa = '捕蛇者说'>>> re.match('\w{1,20}', aa)>>> bb = 'abc123ADB'>>> re.match('\w{1,20}', bb)
<_sre.SRE_Match object at 0x1031b0b28>

我们可以看到，在python2中，\w是无法匹配中文的。那么，同样的代码在Python3中运行结果是什么样子的了？

~|⇒ python3Python 3.7.1 (default, Nov 28 2018, 11:55:14)
[Clang 9.0.0 (clang-900.0.39.2)] on darwinType "help", "copyright", "credits" or "license" for more information.>>> import re>>> aa = '捕蛇者说'>>> re.match('\w{1,20}', aa)
>>> bb = 'abc123ADB'>>> re.match('\w{1,20}', bb)

但在Python3中\w是可以匹配中文的，这是怎么回事了？要回答这个问题，我们要回到Python官方文档中来寻找答案。

解决问题

当我们仔细阅读Python的官方文档时，就会发现，对于同样的正则规则\w，Python2和Python3区别好大，我们先来看看Python2：

When the LOCALE and UNICODE flags are not specified, matches any alphanumeric character and the underscore; this is equivalent to the set [a-zA-Z0-9_]. With LOCALE, it will match the set [0-9_] plus whatever characters are defined as alphanumeric for the current locale. If UNICODE is set, this will match the characters [0-9_] plus whatever is classified as alphanumeric in the Unicode character properties database.

翻译一下：当没有设置LOCALE(re.L)和UNICODE(re.U)标志，匹配数字字母和下划线，如果设置了LOCALE(re.L)则匹配数字下划线和LOCALE文字。如果设置了UNICODE(re.U)标志，匹配数字下划线和Unicode字符集里的字符。

那么Python3了：

对于 Unicode (str) 样式：
匹配Unicode词语的字符，包含了可以构成词语的绝大部分字符，也包括数字和下划线。如果设置了 ASCII 标志，就只匹配 [a-zA-Z0-9_] 。
对于8位(bytes)样式：
匹配ASCII字符中的数字和字母和下划线，就是 [a-zA-Z0-9_] 。如果设置了 LOCALE 标记，就匹配当前语言区域的数字和字母和下划线。

到此，我明白了，默认情况下，不设置任何标志，Python2 \w匹配ASCII字符集里的字符，包括数字字符和下划线，Python3 \w匹配数字下划线和Unicode字符集。所以，为了迁移方便，如果你想匹配ASCII字符集里的字符，指定标志为re.A，如果你想匹配Unicode字符集里的字符，指定标志为re.U。

感谢各位的阅读，以上就是“Python的正则规则举例分析”的内容了，经过本文的学习后，相信大家对Python的正则规则举例分析这一问题有了更深刻的体会，具体使用情况还需要大家实践验证。这里是创新互联，小编将为大家推送更多相关知识点的文章，欢迎关注！

当前题目：Python的正则规则举例分析
文章出自：http://cdkjz.cn/article/goicjh.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

Python的正则规则举例分析

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

Python的正则规则举例分析

相关资讯

阿里云服务器可以设几个ip 阿里云服务器可以几个人连

linux命令查看sn码 linux怎么查看sn号

linuxvi命令使用 linux vi命令的用法

sap系统深圳代理商的简单介绍

路由器手机能上网电脑不能上网 路由器手机能上网电脑不能上网移动

腾讯云服务器数据盘扩容 腾讯云服务器硬盘扩容

用PHP实现数据库查 php连接数据库查询数据

帝国cms缓存文件在哪里 帝国cms缓存文件在哪里打开

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

路由器手机能上网电脑不能上网路由器手机能上网电脑不能上网移动

腾讯云服务器数据盘扩容腾讯云服务器硬盘扩容

帝国cms缓存文件在哪里帝国cms缓存文件在哪里打开

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接