Ibm cloud 如何使用IBMCloud视觉识别文本提取图像的数字?
我将遵循本教程: 我的目标是阅读一份文件并制作一份目录。内容的类型为KEY-VALUE,类似于VALUE 10.00。我可以提取图像的文本,但我不能提取数字 将问题背景化: 我正在使用这个图像 必须提取的值:Ibm cloud 如何使用IBMCloud视觉识别文本提取图像的数字?,ibm-cloud,ibm-watson,visual-recognition,Ibm Cloud,Ibm Watson,Visual Recognition,我将遵循本教程: 我的目标是阅读一份文件并制作一份目录。内容的类型为KEY-VALUE,类似于VALUE 10.00。我可以提取图像的文本,但我不能提取数字 将问题背景化: 我正在使用这个图像 必须提取的值: DATA 13/06/2016 AGENCIA/CASH 0180/2009 VALOR DEPOSITO EM DINHEIRO 50.00 但当我使用以下调用视觉识别服务时: curl -u "apikey
DATA 13/06/2016
AGENCIA/CASH 0180/2009
VALOR DEPOSITO EM DINHEIRO 50.00
但当我使用以下调用视觉识别服务时:
curl -u "apikey:{API_KEY}" --form "images_file=@teste1.png" "https://gateway.watsonplatform.net/visual-recognition/api/v3/recognize_text?version=2018-03-19" -k
结果一篇:
"text": "data gigolo hora\nman/em 251\nnumero envelope 689 574\nvalor depusitd eh 4\ncpf no defusnantez 614 220\ndata lananzmnz",
"words": [
{
"word": "data",
"location": {
"height": 18,
"width": 40,
"left": 13,
"top": 10
},
"score": 0.6098,
"line_number": 0
},
{
"word": "gigolo",
"location": {
"height": 43,
"width": 57,
"left": 146,
"top": 0
},
"score": 0.4283,
"line_number": 0
},
{
"word": "hora",
"location": {
"height": 18,
"width": 39,
"left": 249,
"top": 11
},
"score": 0.6533,
"line_number": 0
},
{
"word": "man/em",
"location": {
"height": 17,
"width": 72,
"left": 127,
"top": 35
},
"score": 0.8187,
"line_number": 1
},
{
"word": "251",
"location": {
"height": 21,
"width": 30,
"left": 294,
"top": 33
},
"score": 0.9881,
"line_number": 1
},
{
"word": "numero",
"location": {
"height": 21,
"width": 54,
"left": 12,
"top": 52
},
"score": 0.9116,
"line_number": 2
},
注意,有些词是很好的提取,但数字不是,我的主要目标是提取货币价值和日期
要创建我的表格,我可以使用height属性来知道哪个是您各自的数值
那么,我如何提取这些数字呢
附:这是一份葡萄牙语文档。感谢您对该服务的兴趣。。。然而,正如今天提供的一样,这个测试版服务主要是在英语词典上培训的。尽管它可以识别短的数字字符串,但在读取任意数字(如价格、序列号或车牌)等任务上,它的表现并不特别好。此外,巴西葡萄牙语单词可能也找不到。有一种方法可以训练或改进识别这些数字种类?不幸的是,没有,这部分服务是不可训练的。但是,您可以训练自定义分类器生成适用于整个图像的标签,例如,将打印的收据与手写的东西区分开来。