婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 正則表達式之文本模式的匹配和查找

正則表達式之文本模式的匹配和查找

熱門標簽:ai電話機器人搭建 西藏智能外呼系統代理商 甘肅醫療外呼系統排名 貴港公司如何申請400電話 呼叫系統外呼只能兩次 地圖標注教學點 外呼系統無呼出路由是什么原因 400電話辦理電話辦理 梅縣地圖標注

1、需求

我們想要按照特定的文本模式進行匹配或查找。

2、解決方案

如果想要匹配的只是簡單的文字,那么通常只需要用基本的字符串方法就可以了,比如str.find()、str.endswith()、str.startswith()或類似函數。

示例:

text='mark ,帥哥,18,183 帥,mark'
print(text=='mark')
print(text.startswith('mark'))
print(text.startswith('mark'))
print(text.find('帥哥'))

結果:

False
True
True
6

如果更為復雜的匹配則需要使用正則表達式以及re模塊。為了說明使用正則表達式的基本流程,假設我們想匹配以數字形式構成的日期,比如"11/27/2018"。示例如下:

import re
text1='11/27/2018'
text2='Nov 27, 2018'
if re.match(r'\d+/\d+/\d+',text1):
  print('符合模型:數字/數字/數字')
else:
  print('不符合模型:數字/數字/數字')

if re.match(r'\d+/\d+/\d+',text2):
  print('符合模型:數字/數字/數字')
else:
  print('不符合模型:數字/數字/數字')

運行結果:

符合模型:數字/數字/數字
不符合模型:數字/數字/數字

如果打算針對同一模型做多次匹配,那么通常會先將正則表達式模式預編譯成一個模式對象。

例如:

import re
text1='11/27/2018'
text2='Nov 27, 2018'
datepat=re.compile(r'\d+/\d+/\d+')
if datepat.match(text1):
  print('符合模型:數字/數字/數字')
else:
  print('不符合模型:數字/數字/數字')

if datepat.match(text2):
  print('符合模型:數字/數字/數字')
else:
  print('不符合模型:數字/數字/數字')

結果:

符合模型:數字/數字/數字
不符合模型:數字/數字/數字

match()方法總是嘗試在字符串的開頭找到匹配項。如果想針對整個文本搜索出所有的匹配項,那么就應該使用findall()方法,例如:

import re
text='今天是 11/27/2018,昨天是11/26/2018'
datepat=re.compile(r'\d+/\d+/\d+')
print(datepat.findall(text))

運行結果:

['11/27/2018', '11/26/2018']

當定義正則表達式時,我們常會將部分模式用括號包起來的方式引入捕獲組,捕獲組通常簡化后續對匹配文本的處理,因為每個組的內容都可以單獨提取出來。findall()方法搜索整個文本并找出所有的匹配項然后將它們以列表的形式返回。如果想以迭代的方式找出匹配項,可以使用finditer()方法。

例如:

import re
#加入捕獲組
datepat=re.compile(r'(\d+)+/(\d+)+/(\d+)')
m=datepat.match('11/27/2018')
print(m.group(0))
print(m.group(1))
print(m.group(2))
print(m.group(3))
print(m.groups())
month,day,year=m.groups()
print(month)
print(day)
print(year)

print('*'*20)

text='今天是 11/27/2018,昨天是11/26/2018'
for month,day,year in datepat.findall(text):
  print('{}-{}-{}'.format(year,month,day))

print('*'*20)

for m in datepat.finditer(text):
  print(m.groups())

結果:

11/27/2018
11
27
2018
('11', '27', '2018')
11
27
2018
********************
2018-11-27
2018-11-26
********************
('11', '27', '2018')
('11', '26', '2018')

3、分析

本節主要介紹了re模塊對文本匹配和搜索的基本功能,首先用re.compile()對模式進行編譯,然后使用想match()、findall()、finditer()這樣的方法做匹配和搜索。

當指定模式時我們通常會使用原始字符串,例如:

r'(\d+)/(\d+)/(\d+)'

這樣的字符串不會對反斜字符轉義,這在正則表達式中非常有用。否則,我們需要用雙反斜杠線來標識一個單獨的'',例如:

'(\\d+)/(\\d+)/(\\d+)'

請注意match()方法只會檢查字符的開頭,有可能出現的匹配的結果并不是你想要的,例如:

import re
#加入捕獲組
datepat=re.compile(r'(\d+)+/(\d+)+/(\d+)')
m=datepat.match('11/27/2018xxxx')
print(m)

結果:

re.Match object; span=(0, 10), match='11/27/2018'>

如果想要精確匹配,可以加一個結束標記:$

import re
#加入捕獲組
datepat=re.compile(r'(\d+)+/(\d+)+/(\d+)$')
m1=datepat.match('11/27/2018xxxx')
m2=datepat.match('11/27/2018')
print(m1)
print(m2)

結果:

None
re.Match object; span=(0, 10), match='11/27/2018'>

如果只是執行簡單的文本匹配和搜索操作,可以省略編譯步驟。
如果打算執行很多匹配或查找操作的話,通常需要先將模式編譯然后重復使用。模塊級的函數會對最近編譯過的模式做緩存處理,并且比較省步驟。

總結

以上所述是小編給大家介紹的正則表達式之文本模式的匹配和查找,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網站的支持!
如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!

您可能感興趣的文章:
  • Java正則表達式實現在文本中匹配查找換行符的方法【經典實例】
  • Java基于正則表達式實現查找匹配的文本功能【經典實例】
  • Go語言正則表達式用法實例小結【查找、匹配、替換等】
  • 學習Java正則表達式(匹配、替換、查找)
  • 正則表達式匹配,替換,查找
  • JAVA中正則表達式匹配,替換,查找,切割的方法

標簽:大興安嶺 湖州 常州 涼山 海口 哈密 泰安 本溪

巨人網絡通訊聲明:本文標題《正則表達式之文本模式的匹配和查找》,本文關鍵詞  正則,表達式,之,文本,模式,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《正則表達式之文本模式的匹配和查找》相關的同類信息!
  • 本頁收集關于正則表達式之文本模式的匹配和查找的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 广南县| 儋州市| 德格县| 建瓯市| 长阳| 门头沟区| 大洼县| 广东省| 泰和县| 勐海县| 汉源县| 射洪县| 福泉市| 榆树市| 通江县| 石河子市| 绍兴县| 梓潼县| 德惠市| 顺平县| 浙江省| 绍兴市| 定西市| 库车县| 双流县| 宣恩县| 泰和县| 开原市| 天柱县| 凤台县| 四川省| 高雄市| 广州市| 阿克陶县| 宿迁市| 文成县| 定安县| 县级市| 乌鲁木齐县| 门源| 清徐县|