欢迎来到淘码网(TMA.CN)

文档结构化还原识别/OCR文字识别(日常3折特惠)

价格: ¥ 99 积分可抵¥ 1

最后更新: 2019-12-15 20:56:09

演示地址:

安装费: 免费

分类
类 型
品 牌
语 言
数据库
是否加密
是否授权
大小
10 MB
发货方式
自动发货
下载方式
远程下载

API接口

ocrDocumentStructure

ocrDocumentStructure

调用地址:https://ocrapi-document-structure.taobao.com/ocrservice/documentStructure

请求方式:POST

返回类型:JSON

API 调用:API 简单身份认证调用方法(APPCODE)展开API 签名认证调用方法(AppKey & AppSecret)

调试工具:去调试

请求参数(Headers)

无参数

请求参数(Query)

无参数

请求参数(Body)
{
  //图像数据:base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式,和url参数只能同时存在一个
  "img": "",
  //图像url地址:图片完整URL,URL长度不超过1024字节,URL对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式,和img参数只能同时存在一个
  "url": "",
  //是否需要识别结果中每一行的置信度,默认不需要。 true:需要 false:不需要
  "prob": false,
  //是否需要单字识别功能,默认不需要。 true:需要 false:不需要
  "charInfo": false,
  //是否需要自动旋转功能,默认不需要。 true:需要 false:不需要
  "rotate": false,
  //是否需要表格识别功能,默认不需要。 true:需要 false:不需要
  "table": false,
  //是否需要分页功能,默认不需要。 true:需要 false:不需要
  "page": false,
  //是否需要分段功能,默认不需要。 true:需要 false:不需要
  "paragraph": false,
  //是否需要成行功能,默认不需要。 true:需要 false:不需要
  "row": false,
  //是否需要切边功能,默认不需要。 true:需要 false:不需要
  "removeBoundary": false,
  //是否需要去印章功能,默认不需要。 true:需要 false:不需要
  "noStamp": false,
  //字块返回顺序,false表示从左往右,从上到下的顺序,true表示从上到下,从左往右的顺序,默认false
  "sortPage": false
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
请求示例
curl
Java
C#
PHP
Python
ObjectC
curl -i -k -X POST 'https://ocrapi-document-structure.taobao.com/ocrservice/documentStructure'  -H 'Authorization:APPCODE 你自己的AppCode' --data '{
  //图像数据:base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式,和url参数只能同时存在一个
  "img": "",
  //图像url地址:图片完整URL,URL长度不超过1024字节,URL对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式,和img参数只能同时存在一个
  "url": "",
  //是否需要识别结果中每一行的置信度,默认不需要。 true:需要 false:不需要
  "prob": false,
  //是否需要单字识别功能,默认不需要。 true:需要 false:不需要
  "charInfo": false,
  //是否需要自动旋转功能,默认不需要。 true:需要 false:不需要
  "rotate": false,
  //是否需要表格识别功能,默认不需要。 true:需要 false:不需要
  "table": false,
  //是否需要分页功能,默认不需要。 true:需要 false:不需要
  "page": false,
  //是否需要分段功能,默认不需要。 true:需要 false:不需要
  "paragraph": false,
  //是否需要成行功能,默认不需要。 true:需要 false:不需要
  "row": false,
  //是否需要切边功能,默认不需要。 true:需要 false:不需要
  "removeBoundary": false,
  //是否需要去印章功能,默认不需要。 true:需要 false:不需要
  "noStamp": false,
  //字块返回顺序,false表示从左往右,从上到下的顺序,true表示从上到下,从左往右的顺序,默认false
  "sortPage": false
}' -H 'Content-Type:application/json; charset=UTF-8'

//根据API的要求,定义相对应的Content-Type
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
正常返回示例
{
  //唯一id,用于问题定位
  "sid": "bfcb418f71fd057f11ea4e17b15688dc27f9d4c6a47a867a376f251706266353341da54c",
  //算法版本
  "prism_version": "1.0.6",
  //识别的文字块的数量,prism_wordsInfo数组大小
  "prism_wnum": 2,
  //角度,
  "angle": 范围:0-360,0表示向上,90表示向右,180表示向下,270度表示向左
  //识别的文字的具体内容
  "prism_wordsInfo": [
    {
      //文字块
      "word": "2017",
      //置信度
      "prob": 99,
      //文字块的位置,按照文字块四个角的坐标顺时针排列,分别为左上XY坐标、右上XY坐标、右下XY坐标、左下XY坐标
      "pos": [
        {
          "x": 107,
          "y": 203
        },
        {
          "x": 247,
          "y": 203
        },
        {
          "x": 247,
          "y": 213
        },
        {
          "x": 107,
          "y": 213
        }
      ],
      //单字信息
      "charInfo": [
        {
          //单字文字
          "word": "2",
          //单字置信度
          "prob": 99,
          //单字左上角横坐标
          "x": 777,
          //单字左上角纵坐标
          "y": 2993,
          //单字宽度
          "w": 26,
          //单字长度
          "h": 30
        },
        {
          "word": "0",
          "prob": 99,
          "x": 803,
          "y": 2989,
          "w": 32,
          "h": 37
        },
        {
          "word": "1",
          "prob": 99,
          "x": 835,
          "y": 2989,
          "w": 38,
          "h": 39
        },
        {
          "word": "7",
          "prob": 99,
          "x": 873,
          "y": 2988,
          "w": 38,
          "h": 40
        }
      ],
      //如果该文字块在表格内则存在该字段,tableId表示表格的id
      "tableId": 0,
      //如果该文字块在表格内则存在该字段,表示表格中单元格的id
      "tableCellId": 0,
      //行id
      "rowId": 0,
      //段id
      "paragraphId": 0,
      //页id
      "pageId": 0
    }
  ],
  //表格信息,如果不存在表格,则改字段内容为空
  "prism_tablesInfo": [
    {
      //表格id,和prism_wordsInfo信息中的tableId对应
      "tableId": 0,
      //表格中横坐标单元格的数量
      "xCellSize": 1,
      //表格中纵坐标单元格的数量
      "yCellSize": 1,
      //单元格信息,包含单元格在整个表格中的空间拓扑关系
      "cellInfos": [
        {
          //表格中单元格id,和prism_wordsInfo信息中的tableCellId对应
          "tableCellId": 0,
          //单元格中的文字
          "word": ":2017",
          //xStartCell缩写,表示横轴方向该单元格起始在第几个单元格,第一个单元格值为0
          "xsc": 0,
          //xEndCell缩写,表示横轴方向该单元格结束在第几个单元格,第一个单元格值为0,如果xsc和xec都为0说明该文字在横轴方向占据了一个单元格并且在第一个单元格内
          "xec": 0,
          //yStartCell缩写,表示纵轴方向该单元格起始在第几个单元格,第一个单元格值为0
          "ysc": 0,
          //yEndCell缩写,表示纵轴方向该单元格结束在第几个单元格,第一个单元格值为0
          "yec": 0,
          //单元格位置,按照单元格四个角的坐标顺时针排列,分别为左上XY坐标、右上XY坐标、右下XY坐标、左下XY坐标
          "pos": [
            {
              "x": 107,
              "y": 203
            },
            {
              "x": 247,
              "y": 203
            },
            {
              "x": 247,
              "y": 213
            },
            {
              "x": 107,
              "y": 213
            }
          ]
        }
      ]
    }
  ],
  //分页信息
  "prism_pagesInfo": [
    {
      //页id,和prism_wordsInfo信息中的pageId对应
      "pageId": 0,
      //文字内容
      "word": "2017"
    }
  ],
  //分段信息
  "prism_paragraphsInfo": [
     {
       //段id,和prism_wordsInfo信息中的paragraphId对应
       "paragraphId": 0,
       //文字内容
       "word": "2017"
     }
  ],
  //成行信息
  "prism_rowsInfo": [
    {
       //行id,和prism_wordsInfo信息中的rowId对应
       "rowId": 0,
       //文字内容
       "word": "2017"
    }
  ]
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60
  • 61
  • 62
  • 63
  • 64
  • 65
  • 66
  • 67
  • 68
  • 69
  • 70
  • 71
  • 72
  • 73
  • 74
  • 75
  • 76
  • 77
  • 78
  • 79
  • 80
  • 81
  • 82
  • 83
  • 84
  • 85
  • 86
  • 87
  • 88
  • 89
  • 90
  • 91
  • 92
  • 93
  • 94
  • 95
  • 96
  • 97
  • 98
  • 99
  • 100
  • 101
  • 102
  • 103
  • 104
  • 105
  • 106
  • 107
  • 108
  • 109
  • 110
  • 111
  • 112
  • 113
  • 114
  • 115
  • 116
  • 117
  • 118
  • 119
  • 120
  • 121
  • 122
  • 123
  • 124
  • 125
  • 126
  • 127
  • 128
  • 129
  • 130
  • 131
  • 132
  • 133
  • 134
  • 135
  • 136
  • 137
  • 138
  • 139
  • 140
  • 141
  • 142
  • 143
  • 144
  • 145
  • 146
  • 147
  • 148
  • 149
  • 150
  • 151
  • 152
  • 153
  • 154
  • 155
  • 156
  • 157
  • 158
  • 159
  • 160
  • 161
  • 162
失败返回示例
{
  "error_code": 400,
  "error_msg": "img和url参数不能同时存在"
}
  • 1
  • 2
  • 3
错误码定义
错误码错误信息描述
400参数错误具体错误请参考返回的error_msg
401您无该功能的权限,请开通后使用您无该功能的权限,请开通后使用
403购买的容量已用完或者签名错误购买的容量已用完或者签名错误
500服务器错误,请稍后重试服务器错误,请稍后重试
0 (0%)

好评

0 (0%)

中评

0 (0%)

差评

  • 在线客服

    点击这里给我发消息 点击这里给我发消息

    官方微信

    仅处理投诉、举报及平台使用问题;
    商品问题请咨询商家客服!

浏览记录