什么是光学字符识别?
光学字符识别(OCR)是使计算机能够从图像中提取文本数据的技术。对文档(打字,手写或打印)进行OCR处理后,即可轻松地编辑,搜索,索引和检索文本数据。OCR可能会为您日常使用的服务中的许多系统提供动力。OCR的某些应用程序包括用于商务文档的自动数据输入,翻译应用程序,在线数据库(例如Google图书),可自动识别车牌的安全摄像机等。
如果您有兴趣了解有关OCR的更多信息,或希望寻找培训数据来开发自己的OCR系统,Lionbridge AI的我们将最佳OCR和手写数据集的清单整理在一起,以帮助您。
用于机器学习的OCR和手写数据集
NIST数据库:美国国家科学研究院出版了3600位作者的笔迹,其中包括80万个字符图像。
MNIST数据库:原始NIST数据的子集,具有60,000个手写数字示例的训练集。
Devangri字符:手写的Devangari字符数据集,由来自25个本地作者的36个字符类的1800个样本组成。
数学表达式:超过10,000个表达式,包括超过101个数学符号。
汉字:包含909,818张图像的手写汉字数据集,对应大约10篇新闻文章。
阿拉伯语印刷文本:包含113,284个单词的词典,并使用10种阿拉伯字体。
文档数据库:包含189位作家的941个在线手写文档,并涵盖了列表,表格,公式,图表和图形。
Iam在线手写:包含在白板上获得的手写英文文本的形式,并包含1700多个条目。
街景文字:街景文字数据集是从Google街景中获取的,主要用于处理室外街道标牌和木板。
街景门牌号码:包含73257位房屋门牌号码,取自Google街景视图。
自然环境OCR:一个数据集,包含659个现实世界图像以及5238个文本注释。
场景文本:包含在不同环境下捕获的3000张图像,包括在不同光照条件下(白天,夜晚,强烈的人造光等)的室外和室内场景。
文字检测:包含500张自然图像,这些图像是使用袖珍相机拍摄的。室内图像主要是标牌,门牌和警示牌,而室外图像主要是导板和广告牌。
Stanford OCR:包含由Stanford发布的MIT Spoken Language Systems Group收集的手写单词数据集。
Chars74K数据:它具有英文和卡纳达语数字的74K图像。
大白