Python语言技术文档

微信小程序技术文档

php语言技术文档

jsp语言技术文档

asp语言技术文档

C#/.NET语言技术文档

html5/css技术文档

javascript

点击排行

您现在的位置:首页 > 技术文档 > Python网络爬虫

python正则表达式匹配不包含某几个字符的字符串方法

来源:中文源码网    浏览:341 次    日期:2024-04-26 00:56:28
【下载文档:  python正则表达式匹配不包含某几个字符的字符串方法.txt 】


python正则表达式匹配不包含某几个字符的字符串方法
一、匹配目标
文件中所有以https?://开头,以.jpg|.png|.jpeg结尾的字符串
二、尝试过程
1)
自然想到正则表达式r'(https?://.*?.jpg|https?://.*?.png|https?://.*?.jpeg)简化书写为r'(https?://.*?\.(?:jpg|png|jpeg)
匹配结果:['http://sdsdsdadadsdsdsddsdsdawwii,http://sdsdoijcjz.jpg']发现结果并非我们想要的,仔细查看,结果中出现了,或者"等符号,因此需要将这些字符去除
2)更改正则表达式为r'(https?://[^ ",]*?\.jpg|https?://[^ ",]*?\.png)' 简化书写为r'(https?://[^, "]*?\.(?:jpg|png|jpeg))
匹配结果 : [http://sdsdoijcjz.jpg']
完美匹配。
以上这篇python正则表达式匹配不包含某几个字符的字符串方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持中文源码网。

相关内容