极客时间-轻松学习，高效学习-极客邦

Geek_99fab9

2019-05-28

我没有你们优秀，我就明白以后少用点正则😄

编辑回复: 不一样的优秀～恭喜你学到了精华！

 1

 24
陆离

2019-05-28

老师｛1，3｝的意思不是最少匹配一次，最多匹配三次吗，独占模式那个例子为什么会不匹配呢?

作者回复: 你好，老师这里更正一下独占模式的例子，落了一个字符。ab{1,3}+bc



 12
K

2019-06-01

\\?(([A-Za-z0-9-~_=%]++\\&{0,1})+)。老师好，麻烦您讲解一下实际您当时是怎么优化的吗？从哪个正则改成了哪个正则，为什么能有这种优化。谢谢老师。

作者回复: 如果是单个+的情况下，是最大匹配规则，遇到特殊字符串时，会出现回溯问题。这里增加了一个+，变成两个++，变成了独占模式，避免回溯。



 10
没有小名的曲儿

2019-05-28

老师，那个(X|Y|Z)三次index是什么意思呢

作者回复: 指的是String中的indexof方法

 1

 9
Liam

2019-05-29

文中提供的split性能消耗大的例子：
\?(([A-Za-z0-9-~_=%]+)\&{0,1})$"

一个+ 表示量词，至少1个，不是独占模式吧，这里能否详细解释下优化点在哪里

作者回复: 你好，一个+表示匹配一个或多个，表示尽量多的匹配。我们这个再加一个+，\\?(([A-Za-z0-9-~_=%]++\\&{0,1})+)。提供的这个是没有优化的例子。



 8
胖

2019-05-28

字符串替换方法
Replace 普通字符替换
Replaceall 正则替换
一直觉得这两个方法的取名很具有迷惑性



 7
ID171

2019-06-11

还是上边的例子，在字符后面加一个“+”，就可以开启独占模式。

text=“abbc”
regex=“ab{1,3}+bc”

结果是不匹配，结束匹配，不会发生回溯问题。
这里的每一步做了什么，在最大匹配之后又发生了什么

展开

作者回复: 1、匹配regex中的a和text中的a，匹配成功，继续匹配下一个字符；
2、匹配regex中的b{1,3}+，这个时候是最大匹配规则，也就是说text中会尽量多的去匹配b，直到满足3个b字符匹配成功，才会结束b{1,3}的匹配，这里可以直接匹配到text中的abb；
3、由于还没有满足最大3个的匹配需求，会继续匹配text中的c，发现不匹配，这个时候regex会跳到后面这个字符b，拿这个字符继续匹配；
4、regex中的b发现与text中的c不匹配，则进行回溯，回溯到text中的前一个字符b，发现匹配成功；
5、继续regex的下一个字符c与text中的c字符匹配，匹配成功，匹配结束。

 5

 6
ABC

2019-05-30

看完明白了回溯是什么意思，我总结如下:

回溯就比如，食堂吃饭，你一下拿了3个馒头。吃完两个，发现第三个不是你想吃的口味的时候，又把第三个放回去，这就造成了资源浪费。

避免的办法就是，一开始就只拿两个，觉得需要了再去继续拿，也就是懒惰模式。

作者回复: 理解很到位，懒惰就是有拿到馒头就走，非常懒，还有馒头拿也不要了。



 4
WL

2019-05-28

请问一下老师 "NFA 的状态数"这个概念感觉有点抽象我不太理解, 状态数是什么意思, 是NFA可以匹配的字符串的格式枚举吗?

作者回复: 你好 WL，就是不同的匹配格式，例如 ab{1,2}c，则状态数为2, 即 abc abbc。



 3
13524265609

2019-09-09

非捕获分组不用括号括起来不就好了么？

作者回复: 这个最直接了，效果是一样的



 2
Vincent

2019-09-09

正则表达式还分贪婪模式，懒惰模式，独占模式，学习到了新技能，但是对于独占模式一旦匹配失败就返回不成功，是不是有落网之鱼？

作者回复: 是的，根据需求来定



 1
godtrue

2019-09-07

课后思考及问题
任何一个细节问题，都有可能导致性能问题，而这背后折射出来的是我们对这项技术的了解不够透彻。所以我鼓励你学习性能调优，要掌握方法论，学会透过现象看本质。——严重认同，不过必须基础扎实才有机会。

没有完全懂，只知道使用正则表达式有坑，幸好我几乎不用正则表达式，以后也尽量不使用。



 1
Vincent

2019-07-21

一开始不理解什么是正则回溯问题，原来是匹配到了不要的字符。

作者回复: 对的



 1
ddddd🐳

2019-07-12

贪婪总有存在的价值吧；贪恋相比于独占两者匹配结果是不同的，但是贪婪相比于懒惰模式呢，总有优势在吧？

作者回复: 对的，根据业务需要来定，贪婪模式会最大匹配字符。



 1
郁陌陵

2019-07-05

老师，我理解独占模式可以减少回溯，但是不能避免回溯： String regex = "^ab{1,3}+c$";
String str = "abbc"; 这个例子里，b{1,3}+ 在匹配到 abb后，无法匹配c，是需要回溯的

作者回复: 此时不会回溯了，返回不匹配结果。

 1

 1
赵明祥

2020-01-23

文章很棒，但DFA的全称中的automaton拼错了，可以改一下。




字节

2020-01-11

最近工作一直在用正则，也遇到过性能问题，当时也只知道点皮毛没有深入了解，听完后认识更深了




一步

2020-01-09

对与懒惰模式，是不是也有回溯的?比如下面这个：
/ab{1,3}?c/.test('abbc'); // true
当第一个 b 匹配成功后，取正则表达式的下一个字符 c 去匹配字符串，然后发现下一个字符还是b就会重新取正则表达式的上一个 b




杨彬Lennon

2019-11-18

split()好像还有个数组引用问题会导致OOM




赤城

2019-11-07

像老师这样在实际工作中遇到了正则的性能问题，肯定会对关于正则的性能优化印象很深，想我没有遇到过正则的性能优化，这还是第一次听说正则的回溯会导致性能问题，还是要多读书啊



