Computer vision Azure ComputerVision OCR和PDF格式_Computer Vision_Microsoft Cognitive_Azure Cognitive Services

Computer vision Azure ComputerVision OCR和PDF格式

computer-vision

Computer vision Azure ComputerVision OCR和PDF格式,computer-vision,microsoft-cognitive,azure-cognitive-services,Computer Vision,Microsoft Cognitive,Azure Cognitive Services,我发现了几个关于是否以及如何使用认知服务进行OCR的老问题。在上，我可以找到一个循序渐进的描述，告诉我如何从PDF进行OCR。当我像页面底部提到的示例一样进行操作时，仍然会得到unsuppertdMediaType结果 { “代码”：“不支持的媒体类型”， “请求ID”：“c427e1c7-3f99-4a74-a36f-1620e68e3b64”， “消息”：“支持的媒体类型：应用程序/八位字节流、多部分/表单数据或应用程序/json”} 当我将PDF更改为图像时，一切正常。我目前正在跟进

我发现了几个关于是否以及如何使用认知服务进行OCR的老问题。在上，我可以找到一个循序渐进的描述，告诉我如何从PDF进行OCR。当我像页面底部提到的示例一样进行操作时，仍然会得到unsuppertdMediaType结果

{ “代码”：“不支持的媒体类型”， “请求ID”：“c427e1c7-3f99-4a74-a36f-1620e68e3b64”， “消息”：“支持的媒体类型：应用程序/八位字节流、多部分/表单数据或应用程序/json”}

当我将PDF更改为图像时，一切正常。我目前正在跟进但是，尽管请求似乎没有问题，但文档类型仍然不受支持。我呼吁：

https://.cognitiveservices.azure.com/vision/v2.0/ocr?language=de&detectOrientation=true&Ocp-Apim订阅密钥=&内容类型=应用程序/八位字节流

当然，文件包含在正文中

我没有发布C#或PowerShell，因为问题似乎确实与我从上述URL发出的请求有关

有人可以帮助我了解如何通过Azure ComputerVision从PDF获取文本的有效请求吗？

您收到此错误，因为根据

OCR API适用于满足以下要求的图像：

图像必须以JPEG、PNG、GIF或BMP格式显示
输入图像的大小必须介于50 x 50和4200 x 4200像素之间
图像中的文本可以旋转90度的任意倍数加上高达40度的小角度

也就是说，您可以使用新的ReadAPI，因为它支持PDF格式

Read API可处理满足以下要求的图像：

图像必须以JPEG、PNG、BMP、PDF或TIFF格式显示
图像的尺寸必须介于50 x 50和10000 x 10000像素之间。PDF页面必须为17 x 17英寸或更小
映像的文件大小必须小于20 MB

如果您遵循要求并使用正确的端点，它将保证工作