网站建设 >

查看其它板块

python正则表达式的技巧有哪些

本篇内容介绍了“python正则表达式的技巧有哪些”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

峨眉山网站制作公司哪家好，找成都创新互联！从网页设计、网站建设、微信开发、APP开发、响应式网站建设等网站项目制作，到程序开发，运营维护。成都创新互联公司2013年成立到现在10年的时间，我们拥有了丰富的建站经验和运维经验，来保证我们的工作的顺利进行。专注于网站建设就选成都创新互联。

最小匹配

格式：

量词?

注：量词有{n,m}、?、+、*

用处：

在字符串中查找符合正则表达式规则的最短子字符串。

案例：

现有字符串num = ”10-3*(20-10+(-10/5)27/3/3-(-100)/(10-35))"，要提取括号中的内容。

import re

num = '10-3*(20-10+(-10/5)*27/3/3-(-100)/(10-3*5))+(-5*-6)'num2 = re.findall('\(.+?\)', num)num3 = re.findall('\(.+\)', num)print(num2)print(num3)out:['(20-10+(-10/5)', '(-100)', '(10-3*5)']['(20-10+(-10/5)*27/3/3-(-100)/(10-3*5))']

上述代码中num2使用了最小匹配，而num3使用了默认的最大匹配。

请注意num2的正则表达式：

.表示匹配除了换行符之外的所有字符

+表示一个或多个

?表示最小匹配，匹配后面第一个)即返回结果。若没有这个?会匹配到最后一个)才返回结果。

分组

格式：

(\w)

注：在正则表达式中一对括号包围的内容表示分组，正则表达式中可以有多个分组

用处：

匹配字符串，只提取分组中的内容，非分组的内容舍弃不提取。

案例：

str1 = '''
python
java
javascript
'''result1 = re.findall('<\w+>(\w+)<\w+>',str1)print(result1)result2 = re.findall('<(\w+)>\w+<\w+>',str1)print(result2)out:['python', 'java', 'javascript']['a', 'b', 'c']

从result1和result2提取内容的不同可以看到分组的妙用，分组能指定提取符合正则表达式某一段的内容。

分组隐藏

格式：

(?:正则表达式)

注：在括号内以?:开头的分组，匹配到的内容会被隐藏。

另：分组隐藏和分组命名不能同时使用。

用处：

当有用数据和无用数据混在一起时，只能先全取出来，然后对无用数据做分组隐藏，把有用的数据对应的正则表达式用()包起来，这样即可提取出有用数据。

案例：

result1 = re.findall('1(\d)(\d)','167189')print(result1)result2 = re.findall('1(?:\d)(\d)','167189')print(result2)out:[('6', '7'), ('8', '9')]['7', '9']

分组命名

格式：

(?P<名字>正则表达式)

注：?P<名称>，英文书名号内是分组的名称。

用处：

分组命名在有很多段分组时对不同的分组命名，便于使用，防止混淆。

案例：

str1 = 'study python every day'ret = re.search('<(?P\w+)>(?P.*?)',str1)print(ret)print(ret.group('tag'))print(ret.group('name'))out:tag
study python every day

上述案例是一个简单的示范，只有2个分组。但实际爬虫的时候经常会遇到多达10个以上的分组。在分组数量多的时候很容易混淆数据，若使用分组命名会非常方便，根据名字读取对应的数据，提高了代码可读性。

“python正则表达式的技巧有哪些”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注创新互联网站，小编将为大家输出更多高质量的实用文章！

新闻标题：python正则表达式的技巧有哪些
分享路径：http://cdkjz.cn/article/ghijsp.html

返回首页了解更多建站资讯

相关资讯

android配置升级安卓设备升级

关于电视安装html5的信息

html5各间距 html内间距代码

怎么理解mysql子查询 mysql子查询和连接查询效率

mysql跨库查询怎么写 mysql如何跨库查询

青果阅读android 青果阅读app下载苹果

android读取 android读取短信

jquery版本4 jquery版本冲突

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

网站建设开发云南柴油发电机组租用高端网站建设 mswzjz.cn 广告旗帜制作公司宣传册设计网站seo优化 tjdkfx.com 成都柴油发电机销售 B2C电商系统

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

成都快上网科技有限公司-四川网站建设设计公司 | 蜀ICP备19037934号 Copyright 2020,ALL Rights Reserved cdkjz.cn | 成都网站建设 | © Copyright 2020版权所有.

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

python正则表达式的技巧有哪些

最小匹配

分组

分组隐藏

分组命名

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

python正则表达式的技巧有哪些

最小匹配

分组

相关资讯

android配置升级 安卓设备升级

关于电视安装html5的信息

html5各间距 html内间距代码

怎么理解mysql子查询 mysql子查询和连接查询效率

mysql跨库查询怎么写 mysql如何跨库查询

青果阅读android 青果阅读app下载苹果

android读取 android读取短信

jquery版本4 jquery版本冲突

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

android配置升级安卓设备升级

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接