Python 逆向抓取 APP 数据

开发 后端
今天继续给大伙分享一下 Python 爬虫的教程,这次主要涉及到的是关于某 APP 的逆向分析并抓取数据,关于 APP 的反爬会麻烦一些,比如 Android 端的代码写完一般会进行打包并混淆加密加固,所以除了抓包之外,还需要对 APP 进行查壳脱壳反编译等操作。

今天继续给大伙分享一下 Python 爬虫的教程,这次主要涉及到的是关于某 APP 的逆向分析并抓取数据,关于 APP 的反爬会麻烦一些,比如 Android 端的代码写完一般会进行打包并混淆加密加固,所以除了抓包之外,还需要对 APP 进行查壳脱壳反编译等操作。

[[339072]]

接下来由「小帅b的朋友:Houser」 给大家演示一下,如何逆向抓取 APP 数据,给你参考一下思路:

所需设备和环境:

  • 设备:安卓手机
  • 抓包:
  • fiddler+xposed+JustTrustme
  • 查壳:ApkScan-PKID
  • 脱壳:frida-DEXDump
  • 反编译:jadx-gui
  • hook:frida

抓包

手机安装app,设置好代理,打开 fiddler 先来抓个包,发现这个 app 做了证书验证,fiddler 开启之后 app提示连接不到服务器:

那就是 app 做了 SSL pinning 证书验证,解决这种问题一般都是安装 xposed 框架,里面有一个 JustTrustme 模块,它的原理就是hook,直接绕过证书验证类,安装方法大家百度吧。

之后再打开app,可以看到成功抓到了包:

先简单分析一下,可以看到请求体中 formdata 是密文,响应内容也是密文,这个请求和响应中有用信息非常少,甚至都不知道在 jadx-gui 里怎么搜索,请求体中 formdata 是以两个等号结尾的,应该是个 base64 编码,其他一概不知。。。

脱壳反编译

那先来反编译,在这之前,通常是先用查壳工具检查一下 app 是否加固,打开 ApkScan-PKID ,把 app 拖入:

可以看到这个 app 使用了 360 加固,真是层层设限啊!!这里使用frida-DEXDump来脱壳,可以到 github 上下载 frida-DEXDump 的源代码,完成之后打开项目所在文件夹,在当前位置打开命令行运行以下命令:

  1. python main.py 

等待脱壳完成,可以看到当前项目中生成了一个对应文件夹,里面有很多dex文件:

 

Python 逆向抓取 APP 数据

下面用 jadx-gui 打开 dex 文件,一般先从最大的文件开始依次搜索关键字,我们知道 java 中使用 base64 是有 BASE64Encoder 关键字的,因为抓包得到的信息非常少,在这里就只能搜索这个关键字了,搜到第四个dex中,得到了疑似加密处:

 

Python 逆向抓取 APP 数据

可以看到是使用了一个 aes 加密,密钥是固定的字符串。

Frida Hook

Java不太熟,分析不来,直接使用 frida 来写一段 hook 代码看一看 encrypt 函数入参和出参的内容:

 

Python 逆向抓取 APP 数据

同时来抓包对比:

 

Python 逆向抓取 APP 数据

 

Python 逆向抓取 APP 数据

就得到了这里的请求 data 入参数据:

  • pageIndex:当前页码
  • pageSize:当前页对应的数据条数

typeId 和 source 是固定的, 接下来再来 hook decrypt 函数,对比抓包和 hook 结果:

 

Python 逆向抓取 APP 数据

 

Python 逆向抓取 APP 数据

结果是一样的,至此,我们逆向分析就完成了。

总结一下请求和响应过程,就是请求体中的 data 经过 encrypt 函数加密传参,改变 pageIndex 就可以得到每页数据,响应是经过 decrypt 函数加密显示,那我们只需要在 python 中实现这个 aes 加密解密过程就行了,从反编译的 java 代码中可以看出密钥是固定的:wxtdefgabcdawn12,没有 iv 偏移。

请求

直接上代码:

 

Python 逆向抓取 APP 数据

运行代码,成功拿到数据:

 

Python 逆向抓取 APP 数据

ok,以上就是逆向 app 爬虫的全部内容,可以看到,现在数据加密已经很普遍了,随便一个很小的 app 都有好几道数据保护机制,这次只涉及到 java 层的加密,下次来讲讲 native 层加密的 hook 方法、frida-rpc 主动调用以及逆向神器 inspeckage 的应用。

最后,以上内容仅供学习交流,小帅b今天的分享希望能给你带来一点帮助,那么我们下回见,peace!

责任编辑:未丽燕 来源: 今日头条
相关推荐

2015-01-09 16:32:25

2021-01-14 18:03:31

Python抖音app数据

2021-12-13 10:31:28

抖音AppPython

2021-05-21 12:52:47

网络安全Android App虚拟机

2016-10-24 14:53:30

Android app使用技巧

2023-01-28 08:00:00

PythonHTML表格数据

2023-11-27 08:51:46

PythonRequests库

2013-04-24 14:23:58

信息泄露个人隐私

2017-01-20 08:44:53

Apache Flum抓取数据

2010-03-09 15:48:06

Python抓取

2019-06-18 10:49:41

Python技术web

2014-03-31 10:51:40

pythonasyncio

2016-10-14 13:10:35

2022-04-06 09:02:58

JS反编译App

2017-05-08 15:47:06

2020-10-12 08:19:43

Python爬虫网页数据

2021-12-02 10:25:25

HttpCanaryApp视频

2023-10-30 09:38:12

GUI程序接口方法

2010-03-03 15:39:50

Python抓取网页内

2012-07-17 09:13:14

Scrapy
点赞
收藏

51CTO技术栈公众号