Ibm cloud 如何使用IBMCloud视觉识别文本提取图像的数字？_Ibm Cloud_Ibm Watson_Visual Recognition

Ibm cloud 如何使用IBMCloud视觉识别文本提取图像的数字？

ibm-cloud

Ibm cloud 如何使用IBMCloud视觉识别文本提取图像的数字？,ibm-cloud,ibm-watson,visual-recognition,Ibm Cloud,Ibm Watson,Visual Recognition,我将遵循本教程：我的目标是阅读一份文件并制作一份目录。内容的类型为KEY-VALUE，类似于VALUE 10.00。我可以提取图像的文本，但我不能提取数字将问题背景化：我正在使用这个图像必须提取的值： DATA 13/06/2016 AGENCIA/CASH 0180/2009 VALOR DEPOSITO EM DINHEIRO 50.00 但当我使用以下调用视觉识别服务时： curl -u "apikey

我将遵循本教程：

我的目标是阅读一份文件并制作一份目录。内容的类型为KEY-VALUE，类似于VALUE 10.00。我可以提取图像的文本，但我不能提取数字

将问题背景化：我正在使用这个图像

必须提取的值：

DATA                        13/06/2016
AGENCIA/CASH                0180/2009
VALOR DEPOSITO EM DINHEIRO  50.00

但当我使用以下调用视觉识别服务时：

curl -u "apikey:{API_KEY}" --form "images_file=@teste1.png" "https://gateway.watsonplatform.net/visual-recognition/api/v3/recognize_text?version=2018-03-19" -k

结果一篇：

        "text": "data gigolo hora\nman/em 251\nnumero envelope 689 574\nvalor depusitd eh 4\ncpf no defusnantez 614 220\ndata lananzmnz",
        "words": [
            {
                "word": "data",
                "location": {
                    "height": 18,
                    "width": 40,
                    "left": 13,
                    "top": 10
                },
                "score": 0.6098,
                "line_number": 0
            },
            {
                "word": "gigolo",
                "location": {
                    "height": 43,
                    "width": 57,
                    "left": 146,
                    "top": 0
                },
                "score": 0.4283,
                "line_number": 0
            },
            {
                "word": "hora",
                "location": {
                    "height": 18,
                    "width": 39,
                    "left": 249,
                    "top": 11
                },
                "score": 0.6533,
                "line_number": 0
            },
            {
                "word": "man/em",
                "location": {
                    "height": 17,
                    "width": 72,
                    "left": 127,
                    "top": 35
                },
                "score": 0.8187,
                "line_number": 1
            },
            {
                "word": "251",
                "location": {
                    "height": 21,
                    "width": 30,
                    "left": 294,
                    "top": 33
                },
                "score": 0.9881,
                "line_number": 1
            },
            {
                "word": "numero",
                "location": {
                    "height": 21,
                    "width": 54,
                    "left": 12,
                    "top": 52
                },
                "score": 0.9116,
                "line_number": 2
            },

注意，有些词是很好的提取，但数字不是，我的主要目标是提取货币价值和日期

要创建我的表格，我可以使用height属性来知道哪个是您各自的数值

那么，我如何提取这些数字呢

附：这是一份葡萄牙语文档。

感谢您对该服务的兴趣。。。然而，正如今天提供的一样，这个测试版服务主要是在英语词典上培训的。尽管它可以识别短的数字字符串，但在读取任意数字（如价格、序列号或车牌）等任务上，它的表现并不特别好。此外，巴西葡萄牙语单词可能也找不到。

有一种方法可以训练或改进识别这些数字种类？不幸的是，没有，这部分服务是不可训练的。但是，您可以训练自定义分类器生成适用于整个图像的标签，例如，将打印的收据与手写的东西区分开来。