加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 正文

8.6M超轻量中英文OCR模型开源,训练部署一条龙

发布时间:2020-07-18 23:07:49 所属栏目:创业 来源:站长网
导读:副标题#e# 本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 要说生活里最常见、最便民的AI应用技术,OCR(光学字符识别)当属其中之一。 寻常到日常办理各种业务时的身份证识别,前沿到自动驾驶车辆的路牌识别,都少不了它的加持。 作

为了方便开发者使用自己的数据自定义超轻量模型,除了8.6M超轻量模型外,PaddleOCR同时提供了2种文本检测算法(EAST、DB)、4种文本识别算法(CRNN、Rosseta、STAR-Net、RARE),基本可以覆盖常见OCR任务的需求,并且算法还在持续丰富中。

特别是「模型训练/评估」中的「中文OCR训练预测技巧」,更是让人眼前一亮,点进去可以看到「中文长文本识别的特殊处理、如何更换不同的backbone等业务实战技巧」,相当符合开发者项目实战中的炼丹需求。

8.6M超轻量中英文OCR模型开源,训练部署一条龙 | Demo在线可玩打通预测部署全流程

对开发者更友好的是,PaddleOCR提供了手机端(含iOS、Android Demo)、嵌入式端、大规模数据离线预测、在线服务化预测等多种预测工具组件的支持,能够满足多样化的工业级应用场景。

8.6M超轻量中英文OCR模型开源,训练部署一条龙 | Demo在线可玩数据集汇总

项目帮开发者整理了常用的中文数据集、标注和合成工具,并在持续更新中。

目前包含的数据集包括:

5个大规模通用数据集(ICDAR2019-LSVT,ICDAR2017-RCTW-17,中文街景文字识别,中文文档文字识别,ICDAR2019-ArT) 大规模手写中文数据集(中科院自动化研究所-手写中文数据集) 垂类多语言OCR数据集(中国城市车牌数据集、****信用卡数据集、验证码数据集-Captcha、多语言数据集)

还整理了常用数据标注工具(labelImg、roLabelImg、labelme)、常用数据合成工具(text_renderer、SynthText、SynthText_Chinese_version、TextRecognitionDataGenerator、SynthText3D、UnrealText)

并且开源以来,受到开发者的广泛关注,已经有大量开发者投入到项目的建设中并且贡献内容。

8.6M超轻量中英文OCR模型开源,训练部署一条龙 | Demo在线可玩

真·干货满满。

8.6M超轻量中英文OCR模型开源,训练部署一条龙 | Demo在线可玩体验一下?

看到这里,你心动了吗?如果还想眼见为实,PaddleOCR已经提供了在线Demo,网页版、手机端均可尝试。

感兴趣的话收好下面的传送门,亲自体验起来吧~

传送门:

项目地址:https://github.com/PaddlePaddle/PaddleOCR

网页版Demo:https://www.paddlepaddle.org.cn/hub/scene/ocr

移动端Demo:

https://ai.baidu.com/easyedge/app/openSource?from=paddlelite

 

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读