总模型仅17M!这个超轻量中文OCR开源项目在Github火了

新闻 开源
光学字符识别(OCR)相信大家都不陌生,就是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

 项目地址:https://github.com/ouyanghuiyu/chineseocr_lite

光学字符识别(OCR)相信大家都不陌生,就是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

目前比较常用的中文OCR开源项目是 chineseocr,最近又有一个新开源的中文OCR项目,登上Github Trending榜单第二——chineseocr_lite

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

这是一个超轻量级中文 ocr,支持竖排文字识别,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 总模型仅 17M。目前已经在Github上标星2.6K,累积343个Fork(Github地址:https://github.com/ouyanghuiyu/chineseocr_lite)

chineseocr_lite实现的功能如下:

  • 提供轻量的backone检测模型psenet(8.5M),crnn_lstm_lite(9.5M) 和行文本方向分类网络(1.5M)
  • 任意方向文字检测,识别时判断行文本方向
  • crnncrnn_lite lstmdense识别(ocr-dense和ocr-lstm是搬运chineseocr的)
  • 支持竖排文本识别
  • ncnn 实现 (支持lstm)
  • mnn 实现

话不多说,先来看看效果:

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

接下来,我们再说一下chineseocr_lite的运行环境:

  • Ubuntu 18.04
  • Python 3.6.9
  • Pytorch 1.5.0.dev20200227+cpu

此外,最近项目作者对更新了可实现的功能。

  • nihui 大佬实现的 crnn_lstm 推理
  • 升级 crnn_lite_lstm_dw.pth 模型 crnn_lite_lstm_dw_v2.pth , 精度更高
  • 提供竖排文字样例以及字体库(旋转 90 度的字体)

如果你也对这个项目感兴趣就赶紧尝试下吧。

 

责任编辑:张燕妮 来源: 开源最前线
相关推荐

2020-07-16 13:00:18

人工智能机器学习技术

2020-07-20 09:49:56

开源技术 趋势

2020-06-08 11:16:06

百度

2021-10-28 16:50:23

OCRNLP开源

2023-11-01 07:24:55

2020-02-24 10:45:44

代码开发工具

2019-10-18 14:57:05

人脸识别AI人工智能

2020-12-01 14:09:38

工具开源Github

2023-09-07 10:37:43

OCR项目字符串

2020-11-24 17:25:19

模型人工智能深度学习

2020-09-15 09:50:47

程序员技能开发者

2020-08-24 10:20:38

微软开源GitHub

2020-07-17 11:30:39

密钥Github数据安全

2020-09-02 14:43:54

GitHub代码开发者

2019-10-14 15:13:24

AI 数据人工智能

2019-09-29 10:42:02

人工智能机器学习技术

2021-05-28 09:51:32

开源技术 工具

2023-10-11 12:25:35

2020-11-26 10:04:04

Java 编程开发

2020-08-06 10:29:38

JavaScript开发技术
点赞
收藏

51CTO技术栈公众号