基于统计分析的手写汉字识别方法实现开题报告

 2022-08-25 20:44:45

全文总字数:3676字

1. 研究目的与意义(文献综述)

当今社会是一个网络四通八达、资源高度共享、信息传播迅速的信息社会。为满足资源共享、信息传播的需要,大量的中文信息都需要在计算机上进行处理。目前,计算机上的中文信息处理系统,可以让人轻松愉快地对输入的中文信息进行处理。然而汉字录入的困难制约着系统的效率,己经成为一个有待解决的“瓶颈”问题。汉字识别的研究与开发,无疑将满足人们对高速自动输入汉字的强烈要求,它在办公自动化、印刷业、信息传播等方面都有着广泛的应用前景。汉字识别是一门多学科综合的研究课题,是模式识别的热点和难点。它不仅与人工智能的研究有关,而且与数字信号处理、图像处理、信息论、计算机科学、几何学、统计学、语言学、生物学、模糊数学、决策论等都有着千丝万缕的联系。一方面各学科的发展给它的研究提供了工具,另一方面,它的研究与开发也必将促进各学科的发展。因而,汉字识别有着重要的理论意义。

早在上世纪六十年代,人们就开始了对印刷体汉字识别的研究工作。最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy。1966年他们发表了第一篇关于汉字识别的文章,用模板匹配法识别1000个印刷汉字。1977年,日本东芝综合研究所研制出能识别2000个印刷体汉字的实验装置;1983年东芝研究中心又进行了对限制性手写体与印刷体汉字识别兼容的研究工作。七十年代末,我国开始了对汉字识别的研究。1985年,南通电子所研究出能识别两种字体1800个单字的识别方法;1986年,清华大学计算机系和沈阳自动化所先后研究出能识别3755个印刷体汉字的实验系统;1986年11月,清华大学的朱夏宁等研究的能识别6763个印刷体汉字的汉字识别试验系统通过了技术鉴定;1992年清华大学的许宁在博士学位论文中,提出了一种基于人工神经网络方法的印刷体汉字识别方法[4]。目前对于印刷体汉字识别的研究工作己经趋于成熟,己有一些实用系统在市场销售。如清华文通、曙光OCR、汉王OCR等。进入90年代,国家教委基础研究与高科技司和国家“八六三”高科技计划智能计算机主题专家组为了了解我国汉字识别的水平,于1991年、1992年和1994年先后召开了三次汉字识别和汉语语音识别评比研讨会。1990年以来,在“八六三”资金的支持下,通过检查、评测以及在市场的激烈竞争中,我国的印刷体汉字识别系统的主要性能指标有了新的突破,在商品市场中逐渐完善,识别系统进入大发展的阶段。

2. 研究的基本内容与方案

原始文本用扫描仪或摄像机进行光电转换输入到计算机中,经过光电转换的文本是一幅两维的点阵图像,图像可以是灰度的,也可以是二值的,现在一般都采用二值图像,即图像中所有象素点的取值非0即1,值为1的点称为前景点或黑点,为0的点称为背景点或白点。

由于目前字符识别算法仍是以每个字符为一个识别单位,因此首先要把单个字符的图像块从文本图像中分割出来,这一过程称为行字分割。一般来说,手写文本没有版面问题,不需要进行版面分析和理解,对于书写在稿纸上的文本,行字分割也很容易,只要书写比较规整,通常只要采用投影方法就能有效地解决这一问题。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

1周 阅读指定的参考资料及文献;完成开题报告;

2-3周 上交开题报告、外文翻译,指导教师批阅;

4-5周进行算法研究,完成算法选取;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

1) 苏统华.脱机中文手写识别—从孤立汉字到真实文本[D]. 哈尔滨:哈尔滨工业大学,20082) Da-Han Wang,Cheng-Lin Liu.Learning confidence transformation for handwritten Chinese text recognition[J]. International Journal on Document Analysis and Recognition (IJDAR).2014 (3)

3) Konstantinos Zagoris,Ioannis Pratikakis,Apostolos Antonacopoulos,Basilis Gatos,Nikos Papamarkos.Distinction between handwritten and machine-printed text based on the bag of visual words model[J].Pattern Recognition.2014 (3)

4)余成波,数字图像处理及实现,重庆大学出版社2002

5)章毓晋.图形处理与分析[M].北京:清华大学出版社,2006.82~85.256~260

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。