视频帧中的文本检测与提取技术

时间:2021-03-03 14:37:24 论文提纲 我要投稿

视频帧中的文本检测与提取技术

    随着计算机和通信技术、宽带网络技术、音视频压缩技术以及计算机硬件技术的发展,图像和视频中的文本信息对索引、检索及高层语义的自动理解等具有重要价值。本文主要研究如何从视频帧中检测、提取与识别人工添加的文本信息。论文的主要工作如下: 首先,根据文本的特征以及目前存在视频图像的文本定位和提取算法,实现了一种基于边缘检测的文本定位方法。实现主要流程包括:对选取的视频帧图像进行灰度化处理、边缘检测、边缘图像二值化及数学形态学操作,最后定位文本区域。实验表明该方法实现简单,并且可以定位出大部分的文本区域,但当图像或视频帧中背景本身包含了丰富的边缘信息时,则定位文本区域就不够准确。 其次,对定位好的文本区域进行提取与识别,本文应用基于值分割方法来提取文本。在处理简单或者单一背景色的文字图像时,使用经典的值分割算法中的最大类间方差法(OTSU),该方法计算简单、稳定有效。在复杂背景下提取文字时,本文使用了局部自适应的`值化方法。经过实验测试,得到了很好的分割效果。 最后,对提取出的文本进行去噪声等处理,最大限度地去除文本的背景,为OCR识别系统提供完整清晰的二值输入文本图像。经“尚书七号”文字识别软件对文本图像进行识别后,结果证明文字的正确识别率能达到80%左右。

请继续阅读相关推荐:毕业论文    应届生求职

毕业论文范文查看下载      查看的论文开题报告