Python正则表达式入门技巧

开发 后端
Python则表达式是一种极其有用的文本处理技术,不过用起来有一定的难度。Python语言的re模块对基本的正则表达式做了许多有益的改进。

下面的文字中,不仅单词to,此外像together和town这些单词中也包含字符串to,如果这时再用上面的Python则表达式to来查找“单词”to的话,就会出错了。

对于需要处理文本的程序员来说,必须对正则表达式有一个全面深入的认识。本文为不熟悉正则表达式的读者提供了一个快速入门的教程。当然,对于那些熟悉其他语言中的正则表达式的部分读者而言,本文也是有益的,因为您可以从中了解Python语言在正则表达式方面的特别之处。

一、什么是Python则表达式在编写处理字符串的程序或网页时,经常会有查找符合某些复杂规则(或称为模式)的字符串的需要。正则表达式就是用于描述这些规则(或模式)的工具。换句话说,正则表达式就是记录文本规则的代码。

一旦发现了符合要求的文本,就可以用对其进行相应的修改了。大家还记得Windows命令行中用于文件查找的通配符吧,即*和?。当我们查找某目录下所有的PDF文档的时候,只要搜索*.pdf即可。

在这里,*会被解释成任意的字符串。和通配符类似,正则表达式也是用来进行文本匹配的工具,只不过较之于通配符,它能更精确地描述你的需求,例如用来查找一个web页面中的所有电话号码。

我们知道,电话号码一般都有一个固定的写法:区号-电话号码,即有以0开头,后跟2-3个数字,然后是一个连字号“-”,***是7或8位数字组成的字符串(例如010-12345678或0634-1234567)。

二、最简单的正则表达式
学习正则表达式的***方法是从具体的示例入手,让读者亲自动手实验。下面给出了不少简单的例子,并对它们作了详细的说明。当我们在一字符串中查找to,你可以使用正则表达式to。这几乎是最简单的正则表达式了。

它可以精确匹配这样的字符串:由两个字符组成,前一个字符是t,后一个是o。了演示,我们提供了一个函数re_show(),可以把看作是re模块的一个封装器,它会把给定的字符串中匹配(说某个字符串与某个正则表达式匹配。

通常是指这个字符串里有一部分或几部分或全部能满足表达式给出的条件)的内容加上一个花括号。现在我们不对该函数做进一步的介绍。您只要知道re_show()的***个参数是一个Python则表达式,第二个参数是要匹配的字符串,当找到匹配的内容时,就用花括号将它括起来就行了。还是源代码如下:

  1. class Category(models.Model):     
  2.     id = models.AutoField('id', primary_key=True)     
  3.     name = models.CharField(maxlength=50)     
  4.     code = models.CharField(maxlength=50)     
  5.     parentCategory = models.ForeignKey('self', 'id', null=True)     
  6.     enable = models.BooleanField()     
  7.          
  8.     def __str__(self):     
  9.         return self.name     
  10.          
  11.     class Admin:     
  12.         list_display = ('id', 'name', 'code', 'parentCategory')   

其中,函数调用re_show("to",s)的作用就是查找字符串s中是否包含字符串to,或者说字符串s是否匹配正则表达式to;如果匹配的话,就给字符串to加上花括号。上述代码的执行结果。

【编辑推荐】

  1. 漫谈Python 源代码编制技巧 简单易于操作的Python 工具详解
  2.  
  3. 有关Python应用领域进行说明介绍
  4. PythonAndroid面向对象的编程——Python应用程序
  5. 如何使用Python模块解析配置文件 ?
责任编辑:chenqingxiang 来源: IT168
相关推荐

2019-12-10 10:40:57

Python正则表达式编程语言

2009-02-18 09:48:20

正则表达式Java教程

2009-08-17 13:56:28

C#正则表达式入门

2021-01-27 11:34:19

Python正则表达式字符串

2010-02-24 17:13:47

2010-03-25 18:25:36

Python正则表达式

2019-11-29 16:25:00

前端正则表达式字符串

2018-09-27 15:25:08

正则表达式前端

2010-07-22 09:12:05

Perl正则表达式

2020-09-04 09:16:04

Python正则表达式虚拟机

2010-03-11 08:55:45

python正则表达式

2023-09-04 15:52:07

2009-09-16 18:19:34

正则表达式组

2017-05-12 10:47:45

Linux正则表达式程序基础

2019-07-17 15:45:47

正则表达式字符串前端

2011-06-02 12:34:16

正则表达式

2022-03-28 06:19:14

正则表达式开发

2020-11-04 09:23:57

Python

2009-09-16 17:15:57

正则表达式引擎

2016-11-10 16:21:22

Java 正则表达式
点赞
收藏

51CTO技术栈公众号