正则表达式的选择符探讨

开发 后端
正则表达式的选择符探讨主要向你介绍了在正则表达式是如何实现选择匹配的,那么关于具体的细节以及原理本文会向你详细介绍。

正则表达式的选择符的操作使得我们在使用正则表达式是更加得心应手,那么具体的实现有什么呢?还有就是正则表达式选择符的使用原理是什么呢?让我们来看看具体的内容。

正则表达式中“|”表示选择。你可以用选择符匹配多个可能的正则表达式中的一个。

如果你想搜索文字“cat”或“dog”,你可以用<<cat|dog>>。如果你想有更多的选择,你只要扩展列表<<cat|dog|mouse|fish>>。

选择符在正则表达式中具有***的优先级,也就是说,它告诉引擎要么匹配选择符左边的所有表达式,要么匹配右边的所有表达式。你也可以用圆括号来限制选择符的作用范围。如<<\b(cat|dog)\b>>,这样告诉正则引擎把(cat|dog)当成一个正则表达式单位来处理。

正则表达式的选择符的原理分析:

注意正则引擎的“急于表功”性

正则引擎是急切的,当它找到一个有效的匹配时,它会停止搜索。因此在一定条件下,选择符两边的表达式的顺序对结果会有影响。假设你想用正则表达式搜索一个编程语言的函数列表:Get,GetValue,Set或SetValue。一个明显的解决方案是<<Get|GetValue|Set|SetValue>>。让我们看看当搜索SetValue时的结果。

因为<<Get>>和<<GetValue>>都失败了,而<<Set>>匹配成功。因为正则导向的引擎都是“急切”的,所以它会返回***个成功的匹配,就是“Set”,而不去继续搜索是否有其他更好的匹配。

和我们期望的相反,正则表达式并没有匹配整个字符串。有几种可能的解决办法。一是考虑到正则引擎的“急切”性,改变选项的顺序,例如我们使用<<GetValue|Get|SetValue|Set>>,这样我们就可以优先搜索最长的匹配。我们也可以把四个选项结合起来成两个选项:<<Get(Value)?|Set(Value)?>>。因为问号重复符是贪婪的,所以SetValue总会在Set之前被匹配。

一个更好的方案是使用单词边界:<<\b(Get|GetValue|Set|SetValue)\b>>或<<\b(Get(Value)?|Set(Value)?\b>>。更进一步,既然所有的选择都有相同的结尾,我们可以把正则表达式优化为<<\b(Get|Set)(Value)?\b>>。
 

正则表达式的选择符相关的内容就向你介绍到这里,希望对你了解和掌握正则表达式的选择符方面的操作有所帮助。

【编辑推荐】

  1. ?*或+正则表达式使用详解
  2. 实现正则表达式匹配任意字符解析
  3. 浅析正则表达式实现字符串的相关操作
  4. Java正则表达式实现条件查询浅析
  5. 正则表达式匹配单词细节解析
责任编辑:仲衡 来源: 百度空间
相关推荐

2010-01-05 17:46:04

.NET Framew

2018-09-27 15:25:08

正则表达式前端

2009-11-30 17:06:35

PHP ereg()函

2009-09-16 12:29:27

PHP正则表达式正则表达式修饰符

2009-08-24 16:12:21

正则表达式操作符

2020-09-04 09:16:04

Python正则表达式虚拟机

2010-03-25 18:25:36

Python正则表达式

2009-09-16 17:15:57

正则表达式引擎

2016-11-10 16:21:22

Java 正则表达式

2022-01-04 11:35:03

Linux Shel正则表达式Linux

2023-09-13 08:12:45

2009-08-07 14:24:31

.NET正则表达式

2021-01-27 11:34:19

Python正则表达式字符串

2009-09-16 18:19:34

正则表达式组

2017-05-12 10:47:45

Linux正则表达式程序基础

2009-02-18 09:48:20

正则表达式Java教程

2019-07-17 15:45:47

正则表达式字符串前端

2022-03-28 06:19:14

正则表达式开发

2011-06-02 12:34:16

正则表达式

2012-04-28 15:22:46

PHP
点赞
收藏

51CTO技术栈公众号