3.10.1.1.4.      通用文字识别(含位置高精度版)

一、功能描述

·                                 对图片中的文字进行识别。

二、属性

基本

·                                 显示名称:活动的显示名称。

输入

·                                 APIKey您的APIKey

·                                 SecretKey您的SecretKey

·                                 Image图像类型:要进行处理的图像,仅支持Image类型。如果设置了此属性,则忽略输入项中的文件路径属性。

·                                 文件路径:图像的完整路径以及名称。如果设置了此属性,请忽略输入项中的Image图像类型属性。

输出

·                                 结果图片的识别结果,仅支持System.String类型。

选项

·                                 置信度:是否返回识别结果中每一行的置信度。

·                                 定位单字符位置:是否定位单字符位置,默认为big(不定位单字符位置)。

·                                 返回顶点位置:是否返回文字外接多边形顶点位置,不支持单字位置,默认为false

·                                 检测图像朝向:是否检测图像朝向,默认不检测。朝向是指输入图像是正常方向还是逆时针旋转90/180/270度。

三、具体步骤
1、关于如何取得APIKeySecretKey,请参考4.2.6如何调用百度云OCR

2、在使用通用文本识别组件时,需要输入图片路径或是Image类型图像,同时需要创建一个String类型的变量用于接收输出结果,输出结果如图3.10.1.1.4-1

3.10.1.1.4-1

3、输出结果详细信息如下:

·                                 log_id:唯一的log id,用于问题定位。

·                                 direction:图像方向,当检测图像朝向为true时存在。-1:未定义;0:正向;1: 逆时针90度;2:逆时针180度;3:逆时针270度。

·                                 words-result-num:识别结果数,表示words_result的元素个数。

·                                 words_result:定位和识别结果数组。

·                                 vertexes_location:当前为四个顶点: 左上,右上,右下,左下,当返回顶点位置为true时存在。

·                                 x:水平坐标(坐标0点为左上角)。

·                                 y:垂直坐标(坐标0点为左上角)。

·                                 location:位置数组(坐标0点为左上角)。

·                                 left:表示定位位置的长方形左上顶点的水平坐标。

·                                 top:表示定位位置的长方形左上顶点的垂直坐标。

·                                 width:表示定位位置的长方形的宽度。

·                                 height:表示定位位置的长方形的高度。

·                                 chars:单字符结果,定位单字符位置为small时存在。

·                                 char:单字符识别结果。

·                                 probability:行置信度信息。当Probabilitytrue时输出,包括:variance:行置信度方差;average:行置信度平均值;min:行置信度最小值。