這篇文章主要介紹了javascript正則表達(dá)式中分組的相關(guān)資料,包括捕獲性分組和非捕獲性分組,需要的朋友可以參考下
分組在正則中用的還是比較廣的,我所理解的分組 就是一對(duì)括號(hào)() ,每一對(duì)括號(hào) 就代表了一個(gè)分組,
分組可以分為:
捕獲性分組
非捕獲性分組
捕獲性分組
捕獲性分組會(huì)在 比如 match exec這樣的函數(shù)中以第二項(xiàng),第三項(xiàng)的形式得到相應(yīng)分組的結(jié)果。先來(lái)看一個(gè)例子吧
var reg = /test(\d+)/;
var str = 'new test001 test002';
console.log(str.match(reg));
//["test001", "001", index: 4, input: "new test001 test002"]
代碼中 (\d+)是一個(gè)分組(有些人也叫他子模式),但是表示的都是同一個(gè)意思,上面的例子中 test001是完全匹配的結(jié)果
然而 分組的匹配是從整個(gè)完全匹配結(jié)果(也就是test001)中來(lái)查找與子模式\d+匹配的字符,這里顯然是 001.
但是今天遇到的情況是這樣的
var reg = /test(\d)+/;
var str = 'new test001 test002';
console.log(str.match(reg));
//["test001", "1", index: 4, input: "new test001 test002"]
不同之處就是 (\d+) 改為了 (\d)+ ,整個(gè)匹配結(jié)果還是 test001 但是第一個(gè)分組匹配的結(jié)果卻不同。
咱們慢慢來(lái)分析他們的區(qū)別
(\d+) 這整個(gè)是一個(gè)分組的情況,由于 默認(rèn)情況下 匹配模式都是貪婪模式 也就是說盡可能多的去匹配
所有\(zhòng)d+ 匹配到的結(jié)果 是 001 然后 外面添加了一對(duì)括號(hào) 也就是一個(gè)分組,這樣第一個(gè)分組中匹配的結(jié)果就是 001.
再來(lái)看第二個(gè)例子中的 (\d)+ 同樣這也是一個(gè)貪婪模式 首先會(huì)先匹配0然后后面是0 也會(huì)匹配到 最后是1 同樣也匹配到 到此 匹配結(jié)束
看起來(lái)跟第一個(gè)例子中的匹配沒什么區(qū)別,但是這里的 分組(\d)表示 匹配單個(gè)數(shù)字
按照我之前的理解是 會(huì)匹配最開始匹配到的結(jié)果 也就是0 但這種理解是錯(cuò)誤的。由于整個(gè)匹配是貪婪模式,盡可能多的去匹配
分組中的 (\d) 就會(huì)捕獲 最后一次匹配到的結(jié)果 1
如果是非貪婪模式 那就會(huì)盡可能少的去匹配
var reg = /test(\d)+?/;
var str = 'new test001 test002';
console.log(str.match(reg));
//["test001", "0", index: 4, input: "new test001 test002"]
這樣(\d)匹配結(jié)果就是0了,雖然后面還有能夠匹配到的結(jié)果,但是這里是盡可能少的去匹配
非捕獲性分組
var reg = /test(?:\d)+/;
var str = 'new test001 test002';
console.log(str.match(reg));
//["test001", index: 4, input: "new test001 test002"]
非捕獲性分組也就是 有些地方需要用到一對(duì)括號(hào),但是又不想讓他成為一個(gè)捕獲性分組也就是不想讓這個(gè)分組被類似 macth exec 這樣的函數(shù)所獲取到
通常在括號(hào)內(nèi)部的前面加上?: 也就是 (?:pattern)這樣就變成了一個(gè)非捕獲性分組
這樣 match的結(jié)果中就不會(huì)出現(xiàn)分組匹配到的內(nèi)容了 也就是少了 第二項(xiàng)的 1.
這篇文章著重說明 (\d+)和 (\d)+的區(qū)別