这个开源文本识别系统我粉了!

开源
说到文本识别大家已经非常熟悉了,这一技术早就深深融入我们生活的方方面面,今天,猿妹要和大家分享一个可以识别文本背后含义的工具——pyWhat。

说到文本识别大家已经非常熟悉了,这一技术早就深深融入我们生活的方方面面,今天,猿妹要和大家分享一个可以识别文本背后含义的工具——pyWhat。

当你不知道特定一串文本代表什么时,它能快速判断它是否是 email、油管视频编号、手机号 或者是其他信息格式。你给它一个 .pcap 文件或者一段文本,它能告诉你这个文件或是文本代表了什么。

目前,pyWhat已经在Github上标星3.8K,累计分支 127 个

(Github地址:https://github.com/bee-san/pyWhat)

同搜索不同,pyWhat 会自动进行文本分断,例如 5f4dcc3b5aa765d61d8327deb882cf99 如果没有完全匹配的信息格式,pyWhat 会切断文本进行多个不同字符串长度的完全匹配

示例

比如当你遇到了一个名为 WantToCry的新恶意软件,你回想起 Wannacry 并记得它被停止是因为研究人员在代码中发现了一个终止开关。

当一个硬编码到 Wannacry 的域被注册时,病毒就会停止。你可以通过这个工具识别恶意软件中的所有域,并使用域注册器 API 来注册所有域。如果 Wannacry 再次发生,你就可以在几分钟内阻止它,而不是几周。

更快地分析 Pcap 文件

假设你有一个.pcap来自网络攻击的文件。What可以识别并快速找到以下内容:

  • 所有哈希
  • 信用卡号码
  • 加密货币地址
  • 联系方式等

简而言之,只要你想要在一个文件中找出所有有用的结构化数据,pywhat都适合你。

 

责任编辑:赵宁宁 来源: 开源最前线
相关推荐

2021-06-24 13:15:35

开源技术 图像识别

2022-05-06 10:21:22

Python人脸识别

2020-01-13 13:00:59

程序员技能开发者

2021-11-03 10:49:33

人脸识别人工智能技术

2019-06-25 13:47:50

人脸识别AI人工智能

2020-03-30 15:20:56

Java开发代码

2021-04-27 16:04:26

人工智能Python 语音识别

2021-01-12 15:54:03

Vue开发管理系统

2018-05-02 11:38:14

语音识别法院

2024-03-04 15:37:39

2023-08-28 00:33:48

开源语音识别

2021-11-03 13:32:28

MetaFacebook人脸识别

2020-01-30 18:10:28

GitHub代码开发者

2020-08-13 10:01:49

工具代码开发

2020-11-10 10:16:38

Java身份证号码编程语言

2018-06-05 08:45:50

系统苹果软件

2018-05-11 14:10:17

Python人脸识别

2020-12-03 09:47:20

人脸识别系统

2021-12-15 16:54:05

区块链面部识别技术

2021-03-09 11:20:05

人脸识别人工智能AI
点赞
收藏

51CTO技术栈公众号