最新文章專題視頻專題問答1問答10問答100問答1000問答2000關(guān)鍵字專題1關(guān)鍵字專題50關(guān)鍵字專題500關(guān)鍵字專題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關(guān)鍵字專題關(guān)鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
問答文章1 問答文章501 問答文章1001 問答文章1501 問答文章2001 問答文章2501 問答文章3001 問答文章3501 問答文章4001 問答文章4501 問答文章5001 問答文章5501 問答文章6001 問答文章6501 問答文章7001 問答文章7501 問答文章8001 問答文章8501 問答文章9001 問答文章9501
當(dāng)前位置: 首頁(yè) - 科技 - 知識(shí)百科 - 正文

如何使用正則來(lái)查找lookaround

來(lái)源:懂視網(wǎng) 責(zé)編:小采 時(shí)間:2020-11-27 19:57:44
文檔

如何使用正則來(lái)查找lookaround

如何使用正則來(lái)查找lookaround:這次給大家?guī)?lái)如何使用正則來(lái)查找lookaround,使用正則來(lái)查找lookaround的注意事項(xiàng)有哪些,下面就是實(shí)戰(zhàn)案例,一起來(lái)看一下。本文實(shí)例講述了正則表達(dá)式教程之前后查找lookaround。分享給大家供大家參考,具體如下:注:在所有例子中正則表達(dá)式匹配結(jié)果包含在
推薦度:
導(dǎo)讀如何使用正則來(lái)查找lookaround:這次給大家?guī)?lái)如何使用正則來(lái)查找lookaround,使用正則來(lái)查找lookaround的注意事項(xiàng)有哪些,下面就是實(shí)戰(zhàn)案例,一起來(lái)看一下。本文實(shí)例講述了正則表達(dá)式教程之前后查找lookaround。分享給大家供大家參考,具體如下:注:在所有例子中正則表達(dá)式匹配結(jié)果包含在

這次給大家?guī)?lái)如何使用正則來(lái)查找lookaround,使用正則來(lái)查找lookaround的注意事項(xiàng)有哪些,下面就是實(shí)戰(zhàn)案例,一起來(lái)看一下。

本文實(shí)例講述了正則表達(dá)式教程之前后查找lookaround。分享給大家供大家參考,具體如下:

注:在所有例子中正則表達(dá)式匹配結(jié)果包含在源文本中的【和】之間,有的例子會(huì)使用Java來(lái)實(shí)現(xiàn),如果是java本身正則表達(dá)式的用法,會(huì)在相應(yīng)的地方說(shuō)明。所有java例子都在JDK1.6.0_13下測(cè)試通過(guò)。

一、問題引入

在HTML頁(yè)面中,匹配出一對(duì)標(biāo)簽之間的文本,如匹配出頁(yè)面的標(biāo)簽,即<title>與</title>之間的文本:

文本:<head><TITLE>welcome to my page</title></head>

正則表達(dá)式:<[Tt][Ii][Tt][Ll][Ee]>.*?</ [Tt][Ii][Tt][Ll][Ee]>

結(jié)果:<head>【<TITLE>welcome to my page</title>】</head>

分析:<[Tt][Ii][Tt][Ll][Ee]>表示不區(qū)分大小寫,這個(gè)模式匹配到了title標(biāo)簽以及它們之間的文本,但是并不完美,因?yàn)槲覀冎幌胍猼itle標(biāo)簽之間的文本,而不包括標(biāo)簽本身。解決這個(gè)問題我們就需要用到前后查找(lookaround)。

二、向前查找

向前查找指定了一個(gè)必須匹配但不在結(jié)果中返回的模式。向前查找實(shí)際上就是一個(gè)子表達(dá)式,它以?=開頭,需要匹配的文本跟在=的后面。

看一個(gè)匹配出一個(gè)URL地址中協(xié)議部分的例子:

文本:http://blog.csdn.net/mhmyqn

正則表達(dá)式:.+(?=:)

結(jié)果:【http】://blog.csdn.net/mhmyqn

分析:URL地址中協(xié)議部分是在:之前的部分,模式.+匹配任意文本,子表達(dá)式(?=:)匹配:,但是被匹配到的:并沒有出現(xiàn)在結(jié)果中。我們使用?=向正則表達(dá)式引擎表明,只要找到:就行了,但不包括在最終的返回結(jié)果里。這里如果不使用向前匹配(?=:),而是直接使用(:),那么匹配結(jié)果就會(huì)是http:了,它包括了:,并不是我們想要的。

注意:前后查找中的前、后是指模式與被查找文本的相對(duì)位置而言的,左為前,右為后。即向前查找為:xxx(?=xxx),而向后查找為(?<=xxx)xxx,向后查找在接下來(lái)會(huì)介紹到。

三、向后查找

向后查找操作符是?<=。但是并不是所有的正則表達(dá)式實(shí)現(xiàn)都支持向后查找,JavaScript就不支持,java語(yǔ)言支持向后查找。

比如要查找文本當(dāng)中的價(jià)格(以$開頭,后面跟數(shù)字),結(jié)果不包含貨幣符號(hào):

文本:category1:$136.25,category2:$28,category3:$88.60

正則表達(dá)式:(?<=\$)\d+(\.\d+)?

結(jié)果:category1:$【136.25】,category2:$【28】,category3:$【88.60】

分析:(?<=\$)模式匹配$,\d+(\.\d+)?模式匹配整數(shù)或小數(shù)。從結(jié)果可以看出,結(jié)果不沒有包括貨幣符號(hào),只匹配出了價(jià)格。如果不使用向后查找,情況會(huì)是什么樣呢?使用模式$\d+(\.\d+),這樣會(huì)把$包含在結(jié)果中。使用模式\d+(\.\d+),又會(huì)把categery1(23)中的數(shù)字也匹配出來(lái),都不是我們想要的。

注意:向前查找模式的長(zhǎng)度是可變的,它們可以包含.、*、+之類的元字符;而向后查找模式只能是固定長(zhǎng)度,不能包含.、*、+之類的元字符。

四、把向前查找和向后查找結(jié)合起來(lái)

把向前查找和向后查找結(jié)合起來(lái)使用,即可解決前面HTML標(biāo)簽之間的文本的問題:

文本:<head><TITLE>welcome to my page</title></head>

正則表達(dá)式:(?<=<[Tt][Ii][Tt][Ll][Ee]>).*?(?=</ [Tt][Ii][Tt][Ll][Ee]>)

結(jié)果:<head><TITLE>【welcome to my page】</title></head>

分析:從結(jié)果可以看出,問題完美的解決了。(?<=<[Tt][Ii][Tt][Ll][Ee]>)是一個(gè)向后操作,它匹配<title>但不消費(fèi)它,(?=</[Tt][Ii][Tt][Ll][Ee]>)是一個(gè)向前操作,它匹配</title>但不消費(fèi)它。最終返回的匹配結(jié)果只包含了標(biāo)簽之間的文本了。

五、對(duì)前后查找取非

前面說(shuō)到的向前查找和向后查找通常都是用來(lái)匹配文本,其目的是為了確定將被返回的匹配結(jié)果的文本的位置(通過(guò)指定匹配結(jié)果的前后必須是哪些文本)。這種用法叫正向前查找和正向后查找。還有一種負(fù)向前查找和負(fù)向后查找,是查找那些不與給定模式相匹配的文本。

前后查找的操作符:

(?=)正向前查找
(?!)負(fù)向前查找
(?<=)正向后查找
(?<!)負(fù)向后查找

比如一段文本中即有價(jià)格(以$開頭,后面跟數(shù)字)和數(shù)量,我們要找出價(jià)格和數(shù)量,先來(lái)看查找價(jià)格:

文本:I paid $30 for 10 apples, 15 oranges, and 10 pears. I saved $5 onthis order.

正則表達(dá)式:(?<=\$)\d+

結(jié)果:I paid 【$30】 for 10 apples, 15 oranges, and 10 pears. I saved 【$5】 on thisorder.

查找數(shù)量:

文本:I paid $30 for 10 apples, 15 oranges, and 10 pears. I saved $5 onthis order.

正則表達(dá)式:\b(?<!\$)\d+\b

結(jié)果:I paid $30 for 【10】 apples, 【15】 oranges, and 【10】pears. I saved $5 on this order.

相信看了本文案例你已經(jīng)掌握了方法,更多精彩請(qǐng)關(guān)注Gxl網(wǎng)其它相關(guān)文章!

推薦閱讀:

正則表達(dá)式教程的位置匹配教程(附代碼)

用php與js實(shí)現(xiàn)正則匹配數(shù)字和字母組合的密碼

聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

文檔

如何使用正則來(lái)查找lookaround

如何使用正則來(lái)查找lookaround:這次給大家?guī)?lái)如何使用正則來(lái)查找lookaround,使用正則來(lái)查找lookaround的注意事項(xiàng)有哪些,下面就是實(shí)戰(zhàn)案例,一起來(lái)看一下。本文實(shí)例講述了正則表達(dá)式教程之前后查找lookaround。分享給大家供大家參考,具體如下:注:在所有例子中正則表達(dá)式匹配結(jié)果包含在
推薦度:
標(biāo)簽: 查找 around look
  • 熱門焦點(diǎn)

最新推薦

猜你喜歡

熱門推薦

專題
Top