用Python正则表达式如何实现分页按钮href替换

开发 后端
本文主要涉及到的是Python正则表达式中的form对象的替换以及其功能的相关介绍,还有Python正则表达式的相关代码的介绍。

本文主要介绍的是用Python正则表达式如何实现分页按钮href替换,以代码的形式实现Python正则表达式在实际相关应用操作过程中的具体操作,以下就是文章的具体相关内容的介绍。希望你会有所收获。

帖子上有分页功能的按钮,如果不处理,那么点击分页后又会跳回原天涯页面上。所以,这里要做到识别分页href连接,然后替换这个连接。
分页功能按钮的href相关源码如下:

  1. <a href=http://www.tianya.cn/publicforum/content/travel/1/166458.shtml><font color=#246cae>下一页</a> 
  2. 正则表达式 pnext=re.compile("<a *href=([^>]*?)><font[^>]*>下一页</a>") 

使用

  1. filtered_html = pnext.sub(r"<a href=http://laiba.appspot.com/lz?url=\1><font color=#246cae>下一页</font></a>",filtered_html)  

其中\1表示正则表达是匹配后,匹配结果中的组1,既是:[url]http://www.tianya.cn/publicforum/content/travel/1/166458.shtml[/url]
上述替换的结果为,把 原来

  1. <a href=http://www.tianya.cn/publicforum/content/travel/1/166458.shtml><font color=#246cae>下一页</a> 

换成了

  1. <a href=http://laiba.appspot.com/lz?url=http://www.tianya.cn/publicforum/content/travel/1/166458.shtml><font color=#246cae>下一页</a> 

这样就实现的连接的重新替换。
 

 form对象的替换

和连接href对象的替换类似,也是使用睁着表达式来识别 <form>....</form>这样的元素,然后把部分表单元素或者整个表单替换掉,从而实现自己的目的。有兴趣的读者可以进行选择一个html页面,用Python正则表达式进行过滤,实现自己喜欢的功能。

功能有网络钓鱼:

1. 选取一个银行网站,分析其关键部分(登陆)部分的Form。

2. 用自己网站上的脚本进行处理,将其Form部分重定向到自己网站上。

3. 申请和银行类似的域名,伪装链接并将链接发送给水鱼。

这样做效果比建立一个钓鱼网站所花的功夫可能要少,而且还会随着目标网站的更新而更新(因为都是从目标直接拉取页面)。缺点是url可能比较长,容易引起怀疑。

【编辑推荐】

  1. 在PythonS60手机运行过程中的五大步骤
  2. Python环境的实际应用方案介绍与代码详解
  3. Python矩阵转置的实际应用操作方案与代码详解
  4. Python编程语言的实现内幕的相关介绍
  5. Python open读写文件的实际应用方案详解
责任编辑:佚名 来源: 科技资讯网
相关推荐

2009-09-16 14:32:43

PHP正则表达式替换

2012-01-12 10:21:57

正则表达式

2010-03-15 16:13:11

Python正则表达式

2021-01-27 11:34:19

Python正则表达式字符串

2021-05-25 09:18:04

正则表达式Linux字符串

2010-03-25 18:25:36

Python正则表达式

2010-03-15 16:21:28

Python正则表达式

2018-09-27 15:25:08

正则表达式前端

2020-09-04 09:16:04

Python正则表达式虚拟机

2010-03-12 17:44:21

Python正则表达式

2010-07-21 10:43:25

Perl正则表达式匹配

2019-12-10 10:40:57

Python正则表达式编程语言

2010-03-11 08:55:45

python正则表达式

2010-03-01 15:51:59

Python则表达式

2009-06-10 13:51:25

Java正则表达式匹配替换

2009-09-16 17:15:57

正则表达式引擎

2022-01-04 11:35:03

Linux Shel正则表达式Linux

2016-11-10 16:21:22

Java 正则表达式

2023-09-13 08:12:45

2019-07-17 15:45:47

正则表达式字符串前端
点赞
收藏

51CTO技术栈公众号