Menu
0 Comments

应用示例:图像文字识别

Problem Description and Pipeline

在图像文字识别装置中,本人为特定用途而打算从图片中识别出图片击中要害倒转术。,如:

为了引起图像文字识别,通常采用以下试图贿赂。:

  • 倒转术检测(倒转术) 检测)
  • 使具有特征剪裁(使具有特征) 分帧
  • 刻分级(刻) 分级法)

滑动窗口(滑动窗口) 视窗)

滑动窗口是一种从图像中画内容的技术。。

滑动窗口技术也用于单词识别,率先锻炼图案能区别刻与非刻,那时应用滑动窗口技术举行刻识别。,一旦刻识别获得,本人将扩张识别的区域。,那时兼并堆叠区域。。

第一步是倒转术检测。:

刻分割的下一步:

不可更改的一步是刻分级。,应用神经式网络、背衬带菌者机或Logistic回归锻炼分级器。

Getting Lots of Data and Artificial Data

结实本人的图案有任何人不恰当的器材成绩,那时,应用更多的知识来锻炼图案可以获得更合适的的结实。。只因为,本人什么获取知识?

以刻识别为例,本人可以从剧本、广播稿或者电影剧本网站下载各式各样的剧本、广播稿或者电影剧本。,那时应用这些差别的剧本、广播稿或者电影剧本来婚配各式各样的差别的随机BA。,人工体系锻炼知识。

另类的方式是,应用持续存在知识对其举行修正。,如:弯曲如狗后腿的、旋转和含糊处置等。。

用于获取更多知识的几种经用方式是:

Ceiling Analysis:What Part of the Pipeline to Work on Next

在机具背诵击中要害装置,本人通常需求一些试图贿赂来举行终极的预测。,这么,本人什么意识到哪一党派最值当本人花时期和精神去优选法呢?,本人引见了在线辨析。。

本人仍以刻识别为例,流程图如次:

想象刻识别准确为72%。,结实本人举行倒转术检测(倒转术) 检测)党派的准确为100%,结实喻,全部图案的精确的预付到89%。;结实本人穿越刻(刻) 分帧党派的准确为100%,结实喻,全部图案的精确的预付到73%。;结实本人做出刻识别(刻) 识别准确率为100%。,结实喻,全部图案的精确的预付到82%。。

如下本人可以区域裁决。,优选法倒转术检测和刻识别预付了精度,这两个党派是值当本人时期和精神优选法的。。


Coursera版Andrew 这是NG的机具背诵一道菜的完毕。,一道菜设计使忧虑源代码及相互关系教训,使用我的GITHUB。不可更改的,感激赖安 Cheung等网友就绪分享。!

发表评论

电子邮件地址不会被公开。 必填项已用*标注