社区编辑申请
注册/登录
一行代码完成模型训练,30倍加速,3毫秒急速识别,超强图像分类算法开源!
开源 新闻
今天要给大家推荐的是一个完全开源免费的、覆盖人、车、OCR等9大经典识别场景、在CPU上可3毫秒实现急速识别、一行代码就可实现迭代训练的项目!

人脸、车辆、人体属性、卡证、交通标识等经典图像识别能力,在我们当前数字化工作及生活中发挥着极其重要的作用。业内也不乏顶尖公司提供的可直接调用的API、SDK,但这些往往面临着定制化场景泛化效果不好、价格昂贵、黑盒可控性低、技术壁垒难以形成多诸多痛点。

而今天要给大家推荐的是一个完全开源免费的、覆盖人、车、OCR等9大经典识别场景、在CPU上可3毫秒实现急速识别、一行代码就可实现迭代训练的项目!

图片

图1 PaddleClas图像分类应用示意图

话不多说,赶紧送上传送门,识货的小伙伴赶紧尝试一下吧!

https://github.com/PaddlePaddle/PaddleClas

图片

记得Star收藏防止走丢哦!

当然,小编不是只管吆喝的,下面就来详细拆解下这个项目的过人之处吧!

图片

图2 9大场景模型效果示意图

亮点一:完美平衡精度与速度

从大名鼎鼎的Resnet50到如今火热的Swin-Transformer,模型精度不断被刷新,但是预测效率并不高。即使是Swin-Transformer最小的模型,在CPU上的预测速度也超过100ms,远远无法满足产业实时预测的需求。

而使用MobileNet系列等轻量化模型可以保证较高的预测效率,在CPU上预测一张图像大约3ms,但是模型精度往往和大模型有很大差距。

而PaddleClas推出的超轻量图像分类方案(Practical Ultra Light Classification,简称PULC),就完美解决上述产业落地中算法精度和速度难以平衡的痛点。

图片

表1 不同模型精度速度结果对比

如图所示,它的精度与Swin-Transformer等大模型比肩,预测速度却可以快30倍以上,在CPU上的推理时长仅需2ms!

亮点二:易用性极强

PULC方案不仅完美的平衡了精度与速度,还充分考虑了产业实践过程中需要定制化的对算法快速迭代的需求,只需一行命令,就可完成模型训练。

与此同时,PaddleClas 团队还发布了包括人、车、OCR在内的9大场景模型,仅需2步就能实现业务 POC 效果验证,训练、推理、部署一条龙,真正实现“开箱即用”。

图片

不仅如此,项目还匹配了详细的中文使用文档及产业实践范例教程。

图片

图3 使用文档及范例示意图

亮点三:集成超多硬核技术

超轻量图像分类方案(PULC)集成了业界4大业界领先的优化策略:

图片

图4 超轻量图像分类方案(PULC)示意图

PP-LCNet轻量级骨干网络

PP-LCNet作为针对CPU量身打造的骨干网络模型,在速度、精度方面均远超如MobileNetV3等同体量算法,多个场景模型优化后,速度较SwinTransformer的模型快30倍以上,精度较MobileNetV3_small_0.35x高18个点。

SSLD预训练权重

SSLD半监督蒸馏算法可以使小模型学习到大模型的特征和ImageNet22k无标签大规模数据的知识。在训练小模型时,使用SSLD预训练权重作为模型的初始化参数,可以使不同场景的应用分类模型获得1-2.5个点的精度提升。

数据增强策略集成

该方案融合了图像变换、图像裁剪和图像混叠3种数据增强方法,并支持自定义调整触发概率,能使模型的泛化能力大大增强,提升模型在实际场景中的性能。模型可以在上一步的基础上,精度再提升1个点左右。

SKL-UGI知识蒸馏算法

SKL(symmetric-KL)在经典的KL知识蒸馏算法的基础上引入对称信息,提升了算法的鲁棒性。同时,该方案可以方便的在训练中加入无标签训练数据(Unlabeled General Image),可以进一步提升模型效果。该算法可以使模型精度继续提升1-2个点。

责任编辑:张燕妮 来源: 计算机视觉研究院
相关推荐

2022-07-13 16:09:19

模型AI训练

2020-01-21 22:23:18

代码开发AI

2022-04-06 11:10:00

模型训练项目

2020-10-06 19:02:11

代码机器学习igel

2020-05-21 14:50:48

代码机器学习图像

2020-07-13 14:30:35

人工智能机器学习技术

2020-05-18 10:30:16

AI 神经计算人工智能

2021-04-09 14:49:02

人工智能机器学习

2017-07-24 15:06:02

代码人脸识别实践

2021-03-18 15:29:10

人工智能机器学习技术

2021-04-30 07:23:02

人工智能AI深度学习

同话题下的热门内容

Java程序员必须掌握的十款开源工具!盘点12个 yyds 的低代码开源项目新一代开源免费的轻量级 SSH 终端,非常炫酷好用!写给前端的 Docker 入门终极指南,别再说不会用 Docker 了!轻量级开源用户身份验证解决方案 - Hanko免费DIY!微软一口气开源1500个3D表情包,超可爱国内开源软件的发展现状与风险分析GitLab计划自动删除项目?

编辑推荐

十大免费开源云文件共享平台使用Go语言开发必备的5大开源工具开源人脸识别seetaface入门教程(一)Docker不香吗,为啥还要K8s?值得考虑的九大开源ERP系统,看看都有谁
我收藏的内容
点赞
收藏

51CTO技术栈公众号