【中文文本识别系统实现10000字（论文）】.docx

资源描述

《【中文文本识别系统实现10000字（论文）】.docx》由会员分享，可在线阅读，更多相关《【中文文本识别系统实现10000字（论文）】.docx（19页珍藏版）》请在第一文库网上搜索。

1、1绪论21.1 选题背景21.2 选题意义21.3 Java平台的文本识别系统需求31.4 系统可行性分析32系统总体结构设计及功能概述32.1 系统功能结构设计图32.2 图片处理模块42.2.1 上传文件功能42.2.2 图片预览功能42.2.3 图片重识功能52.2.4 图片清除功能52.2.5 截图识别功能52.3 文字识别模块62.3.1 内容展示功能62.3.2 复制文字功能62.3.3 清空文字功能63调用AP1接口73.1 OCR技术73.2 百度AP1接口简介73.3 接口设计与应用84系统的设计流程与实现84.1 系统流程概要介绍84.2 系统模块的划分与执行流程84.3

2、图片处理模块功能的实现94.3.1 上传文件功能94.3.2 图片预览功能104.3.3 图片重识功能H4.3.4 图片清除功能124.3.5 截图识别功能124.4 文字识别模块功能的实现134.4.1 内容展示功能134.4.2 复制文字功能144.4.3 清空文字功能145系统测试165.1 对系统测试的目的和场景165.2 系统测试的设计165.2.1 上传不同文件黑盒测试165.2.2 文字识别性能测试165.2.3 截图功能测试16结论17参考文献17中文文本识别系统的实现1结论1.1 选题背景随着计算机信息技术的发展，可以处理的事情越来越多。在当今社会，计算机不再是专业人士的专利

3、，而是广泛应用于各个方面。从各个方面来看，数字信息时代给人们的生活带来了许多好处。在这些网络产品中，自动识别系统的开发无疑是最丰富的产品之一。目前，人们收到的信息大多来自互联网和各种数字媒体。信息存储有两种形式：纸质文档和数字文档。与纸质文档相比，数字文档具有操作简单、自动分类收集、管理方便、存取方便、存储空间小、检索速度快、资源共享、支持远程浏览等优点，编辑等便捷的数字文档共享可以满足人们对信息获取和处理的需求。尽管近年来数字存储技术发展迅速，但知识的数字化还有很长的路要走。目前，字符识别系统仍处于瓶颈，社会识别有待提高，识别性能等问题亟待解决，这对开发者来说是一个巨大的挑战。随着ORC技术

4、的飞速发展，ORC将逐步普及到人们的日常生活中，在一定程度上提高数字信息的存储速度，使人们的生活更加方便快捷。随着数字多媒体技术的飞速发展，图像无处不在。这些图像通常包含很多个人信息，比如车牌、路标、路标等等。随着越来越多先进的移动智能设备的普及，数字图像、交通标志、遥感图像等被人们随时随地广泛应用于各个领域。为了进一步分析和理解这些图像中包含的个人信息，许多数字图像处理技术应运而生。字符识别是从数字图像中提取字符信息的重要技术。在我们的日常生活中，文本经常被用来提醒人们周围的环境或物体。使用智能仪器检测和识别这些图像中的字符具有非常重要的实际作用。1.2 选题意义未来数字信息存储将发生更多变

5、化。如今，最重要的是编写航空公司或文件，以提高信息存储的稳定性和安全性，因此这两类航空公司是当今信息存储的重要组成部分。为了将数字信息与书面文件结合起来，促迸社会发展，OCR技术必须共存，在技术上迸行更新，使两种存储形式呈现各自的亮点，以解决手写文件与数字信息的互补性，具有更大的现实意义和应用前景。Java平台可能更具挑战性，但它也带来了研究价值。目前，很多识别软件只能识别特定的物体，从而达到一定的特异性或效率。例如，识别软件只能识别字符。普通身份证很快。然而，当前身份识别软件的局限性不仅在于功能的需要，还在于OCR技术的滞后和信息的快速发展，身份证有许多独特的设计和重复程度，各种设计也不常见

6、。在识别输入时，如果我们每次识别不同的ID信息时都使用不同的识别软件，这将花费大量时间，因此我们可以看出在本例中识别是非常必要的。本文基于Java对各种场景和图片进行了测试，对百度、第3页腾讯等知名企业的图片处理和机器学习算法进行了查询，并对具体实现结果进行了分行真有一定的理论研究价值。经过多年的实践，这些算法可以扩展到类似的对象。本文从模式识别的基本原理出发，讨论了如何运用模式识别的基本理论，并找到了将OCR技术应用于字符识别系统的相关算法。字符识别，这种OCR也适用于人工智能或模式分析。在结构分析和全局统计分类分析中，常用的两种方法，如像素法、高度法、宽度法、高度法和特征变换法，该框架的主

7、要特点是通过结合分类语法和合理的场景布局，有效地提出了所有字符。1.3 JaVa平台的文本识别系统需求字符识别系统需要在图像下载后实现字符识别功能，并为使用该系统的用户提供文件下载功能。文件下载后，用户将在系统右侧显示图片并输出，以准确识别文本内容，方便用户更快地使用识别出的文本。该系统具有将文本快速复制到剪贴板的功能，用户可以存储数字信息，并且使用时间更长。如果用户上传了错误的图像或想要再次识别图像，用户可以扫描图像和文本，这减少了许多复杂的操作，使得字符识别系统不仅快速准确地识别，还为用户提供了良好的交互体验。1.4 系统可行性分析(1)经济可行本系统采用的技术和开发环境在实际开发中应用非

8、常广泛，周期预计20天，每天费用按200/天的话需要4000元，并且硬件需求的话也是使用自己的笔记本电脑，开发完后可以部署到自己的电脑系统中，那样服务器的费用也能免了，写作、办公不需要联网也能使用本系统进行文字识别，所以一但应用后可让所有PC端用户都能快捷使用。(2)技术可行我们熟知常规的垂直应用架构现在已经无法应对，分布式服务架构和流动计算架构已势在必行，迫切需一个治理系统确保架构有条不紊的演进。再利用百度应用程序接口集成一些优秀的API接口保证后台的高可用和系统安全,再通过添加1ibraries完成图形化界面的部署，配置后达到一定程度的高可用和易维护，充分说明本系统在技术方面可行WR用通引

9、蒯%2系统总体结构设计及功能概述2.1 系统功能结构设计图通过对以上系统需求的分析，可以看出字符识别系统分为两个模块，主要包括图像处理模块和字符识别功能模块。图像处理模块具有文件选择、图像预览、图像恢复、清晰图像识别、，快照识别等功能。字符识别模块具有内容显示和文本复制扫描文本等功能。使用本系统，用户可以选择下载文件。主要功能是选择计算机来处理各种信息和图像。所选图像在显示和识别后可以自动识别语音识别区域，完成独立的个人信息处理功能，通过内容复制系统功能可以快速使用，用户可以将数字信息存储在桌面上；等待字符识别系统的具体功能和结构如图2-1所示。文字识别系统图2.1功能结构图上传文件清空文字2

10、.2 图片处理模块2.2.1 上传文件功能本系统是基于ec1ipseswing图形界面的模块化设计。它是一个功能强大、重量轻的SWing图形组件。因此，图形界面中的按钮形式称为脚本工具。我设计的上传文件和下面的功能模块设计不再是图形插件的详细描述。当用户需要识别文本图像时，首先上传图像文件。当图形程序插入I/O方法时，此函数称为，但加载类型为数组。这样，如果图像是文件类型，是否加载它。如果文件类型匹配，例如如果没有匹配的文件加载对象，则抛出异常以返回上一个表单。即使在以后的模块中，也只需要使用这种重载方法。详细功能描述见表2.1。表2-1上传文件功能描述上传文件功能描述提供用户进行离线上传文件

11、的功能并同步识别出文字进行的操作判断文件类型是否符合产生的结果如果文件类型符合则同步识别出图片中的文字，如果文件类型不符合则返回上一个窗体2.2.2 图片预览功能成功选择并加载图像后，预览图像将显示在系统中，用户界面将迸行早期定位，图像将再次显示到指定位置，并指定文件长度；高度和方向，这样上传的图片可以再次适应用户界面，用户可以清晰地预览上传的图片。如果上传失败或上传的图片无法提前完成，详细功能描述见表2.2。表2-2图片预览功能描述图片预览功能描述符上传成功的图片预览到界面上进行的操作上传一张需要文字识别的图片产生的结果系统界面上按照指定的缩放图片进行图片的渲染以及回显2.2.3 图片重识功

12、能图片重识功能并不需要重新再次上传文件，所以综上所述只需重载文字识别的方法即可,给用户提供再次识别的功能，让用户更加清晰、准确的知道图片识别的结果是否有误。具体功能描述参见表2-3。表2-3图片重识功能描述一图片重识功能描述无需再次上传文件，提供用户再次对图片进行识别的功能进行的操作对内存中上一次上传的符合文件类型的图片文件进行重载文字识别的方法产生的结果图片重新进行文字识别2.2.4 图片清除功能图片清除功能并不是直接删除这个图片，因为本系统文字识别功能是基于内存来完成的,所以使用本清除功能时对原来上传成功的文件不会产生任何影响，所以也能称作软删除，将图片清除功能之后将失去图片预览功能，但是

13、可以重新进行图片上传功能。具体功能描述参见表2-4。表2-4图片清除功能描述一图片清除功能描述将图片进行清除提供用户下一次上传操作进行的操作在内存中把上一次使用的图片清除产生的结果图片预览中清除掉回显的图片2.2.5截图识别功能当用户需要识别的文本不再是文件类型，但无法招图像类型保存在计算机页面或其他类型的软件中时，图像识别功能可用于识别图像所需的位置，不仅可以准确识别用户的身份，而且还可以自动同步上传到预览区，这样可以有效减少用户访问图像和上传文件等超时操作。详细功能描述见表2,5o表2-5截图识别功能描述截图识别功能描述提供用户对所需要识别文字的地方进行截图选取并同步上传进行的操作将截图选

14、择的部分进行上传产生的结果用户通过截图识别功能选取的部分自动转为图片格式存取到内存中并且进行上传2.3 文字识别模块2.3.1 内容展示功能文字识别模块中最重要的就是把内容准确、迅速、完整的展示给用户，所以内容展示功能是将文字识别方法执行后生成的文字进行展示，和图片预览功能类似，也需要提前设置展示内容的文字大小、定位等，所以用户进行上传完图片之后可以自动将图片中的文字进行渲染到页面中。具体功能描述参见表2-6。表2-6内容展示功能描述内容展示功能描述揩识别后的文字到指定窗体中展示进行的操作将用户上传的图片识别成文字产生的结果在系统右侧图像界面窗体中通过指定的格式渲染出用户识别之后的文字2.3.

15、2 复制文字功能本系统的初衷就是使用户能快捷的从指定文件或位置识别出自己想要的文字，所以复制文字功能完全符合本系统的初衷，让用户识别完之后的文字只用按一个按钮就可将内容复制到剪贴板，其中复制文字功能也是将内容复制到内存中，不会对识别出的文字产生影响。具体功能描述参见表2-7。表27复制文字功能描述复制文字功能描述将识别出来的文字复制到剪贴板中进行的操作执行主窗体界面中的复制功能产生的结果若文字存在则将全部内容复制到剪贴板中，若文字不存在则不产生影响2.3.3 清空文字功能当复制完文字内容之后或者需要重新识别之后即可使用本清空文字功能，本功能和上述的清空图片功能类似，只对内存中剪贴板的内容济宁进行清空，对本系统识别出来的文件不产生影响，清空文字之后界面中将等待重新识别输出内容。具体功能描述参见表2-8。表2-8清空文字功能描述清空文字功能描述提供用户对主窗体中的输出内容进行清空进行的操作将识别出来的文字从内容预览窗体中清除产生的结果若文字存在则将全部内容从窗体中清除，若文

展开阅读全文