逆向爬虫时,Python 如何正确调用 JAR 加密逻辑?

开发 后端
在 App 端爬虫过程中,遇到未知的参数,往往需要我们去逆向破解 App,针对参数的生成逻辑,使用 Python 去实现, 部分 App 参数的生成逻辑可能已经写入到多个 JAR 文件中,这时候,我们只需要用 Python 执行 JAR 即可。

[[373661]]

本文转载自微信公众号「AirPython」,作者星安果 。转载本文请联系AirPython公众号。  

 1. 前言

在 App 端爬虫过程中,遇到未知的参数,往往需要我们去逆向破解 App,针对参数的生成逻辑,使用 Python 去实现

部分 App 参数的生成逻辑可能已经写入到多个 JAR 文件中,这时候,我们只需要用 Python 执行 JAR 即可

本篇文章将聊聊 Python 如何调用 JAR 中的方法

2. 合并 JAR

以 Android App 为例,假设加密参数生成逻辑在多个 JAR 中,我们首先需要将所有的 JAR 文件合并为一个 JAR 文件

PS:对于 AAR 文件,可以先通过解压软件解压,然后再合并 JAR

合并 JAR 分为 2 步:

  • 解压 JAR
  • 合并所有源码

2-1 解压 JAR

安装 JDK 之后,通过 jar -xvf 命令去解压单个 JAR,这样会按包名在同级目录下生成 JAVA 编译后的 class 文件

  1. # 一个个地去解压JAR 
  2. # 在本地生成class文件 
  3. jar -xvf a.jar 
  4. jar -xvf b.jar 
  5. jar -xvf c.jar 

2-2 合并所有源码

使用 jar -cvfM 命令,将本地所有的 class 文件生成一个新的 JAR

  1. # 合并当前目录下所有源码为一个JAR 
  2. # 其中:output.jar代表新的JAR 
  3. jar -cvfM output.jar . 

3. Python 调用 JAR

首先,我们安装依赖包:jpype

  1. # 安装依赖包 
  2. pip3 install JPype1 

假设 JAR 中加密逻辑实现代码如下:

  1. package com.xingag.common; 
  2.  
  3. public class EncryHelper { 
  4.     public String encrypt(String content) { 
  5.           //加密逻辑 
  6.     } 

使用 Python 调用 JAR 中的方法分为 3 步:

  • 启动 JVM
  • 实例化 JAVA 对象,调用对应方法
  • 关闭 JVM

3-1 启动 JVM

  1. import jpype 
  2.  
  3. # JAR本地路径 
  4. jar_path = os.path.join(os.path.abspath('.'), './output.jar'
  5.  
  6. # 启动jvm 
  7. jpype.startJVM(jpype.getDefaultJVMPath(), "-ea""-Djava.class.path=%s" % (jar_path)) 

3-2 实例化 JAVA 对象,调用方法

根据被调方法所在的包名,使用 jpyte 中的 JClass() 方法实例化类 JAVA 对象,最后调用 JAVA 对象的方法即可

需要注意的是,由于 JAVA 中是实例方法,需要先进行对象实例化,然后调用方法;如果是静态方法,可以直接调用方法

  1. # 通过包名,实例化JAVA对象 
  2. EncryClass = jpype.JClass("com.xingag.common.EncryHelper"
  3. encryClass = EncryClass() 
  4.  
  5. # 调用JAVA中的加密方法 
  6. content_encry = encryClass.encrypt("xag"
  7. print(content_encry) 

3-3 关闭 JVM

可以选择主动关闭 JVM,或者待 Python 程序运行后自动关闭,释放资源

  1. import jpype 
  2.  
  3. # 关闭jvm 
  4. jpype.shutdownJVM() 

4. 最后

Python 直接调用 JAR 中方法,可以帮我我们复用轮子,减轻爬虫的工作量!

 

责任编辑:武晓燕 来源: AirPython
相关推荐

2010-02-22 10:06:17

Python调用

2022-01-27 10:26:07

Python

2010-07-01 15:02:29

SQL Server数

2022-07-03 10:43:23

JS逆向破解

2010-03-04 11:07:21

Python解释器

2021-04-12 16:31:09

加密货币资金金融

2010-02-26 11:15:51

WCF接口方法

2022-05-13 09:04:20

Python网络爬虫JS逆向问题

2019-05-13 09:11:41

加密解密Python攻击

2010-02-22 14:13:38

安装Python

2010-02-03 17:42:30

2010-02-03 14:15:18

Python 开发

2015-05-19 16:21:05

2021-04-16 20:50:16

URL爬虫参数

2022-06-27 18:54:54

Python爬虫加密算法

2010-02-03 15:40:37

Python函数

2010-02-24 15:27:26

Python数组

2010-02-02 18:20:43

Python编写

2021-03-15 12:23:24

Pythonyield代码

2010-02-24 10:24:10

Python线程
点赞
收藏

51CTO技术栈公众号