适用于深度学习的 15 种最佳 OCR 数据集

数据集 小白学CV ⋅ 于 11个月前 ⋅ 3375 阅读

file

什么是光学字符识别?

光学字符识别(OCR)是使计算机能够从图像中提取文本数据的技术。对文档(打字,手写或打印)进行OCR处理后,即可轻松地编辑,搜索,索引和检索文本数据。OCR可能会为您日常使用的服务中的许多系统提供动力。OCR的某些应用程序包括用于商务文档的自动数据输入,翻译应用程序,在线数据库(例如Google图书),可自动识别车牌的安全摄像机等。

如果您有兴趣了解有关OCR的更多信息,或希望寻找培训数据来开发自己的OCR系统,Lionbridge AI的我们将最佳OCR和手写数据集的清单整理在一起,以帮助您。

用于机器学习的OCR和手写数据集

NIST数据库:美国国家科学研究院出版了3600位作者的笔迹,其中包括80万个字符图像。

MNIST数据库:原始NIST数据的子集,具有60,000个手写数字示例的训练集。

Devangri字符:手写的Devangari字符数据集,由来自25个本地作者的36个字符类的1800个样本组成。


数学表达式:超过10,000个表达式,包括超过101个数学符号。

汉字:包含909,818张图像的手写汉字数据集,对应大约10篇新闻文章。

阿拉伯语印刷文本:包含113,284个单词的词典,并使用10种阿拉伯字体。


文档数据库:包含189位作家的941个在线手写文档,并涵盖了列表,表格,公式,图表和图形。

Iam在线手写:包含在白板上获得的手写英文文本的形式,并包含1700多个条目。

街景文字:街景文字数据集是从Google街景中获取的,主要用于处理室外街道标牌和木板。


街景门牌号码:包含73257位房屋门牌号码,取自Google街景视图。

自然环境OCR:一个数据集,包含659个现实世界图像以及5238个文本注释。

场景文本:包含在不同环境下捕获的3000张图像,包括在不同光照条件下(白天,夜晚,强烈的人造光等)的室外和室内场景。


文字检测:包含500张自然图像,这些图像是使用袖珍相机拍摄的。室内图像主要是标牌,门牌和警示牌,而室外图像主要是导板和广告牌。

Stanford OCR:包含由Stanford发布的MIT Spoken Language Systems Group收集的手写单词数据集。

Chars74K数据:它具有英文和卡纳达语数字的74K图像。

大白

成为第一个点赞的人吧 :bowtie:
回复数量: 0
暂无回复~
您需要登陆以后才能留下评论!