Computer vision Azure ComputerVision OCR和PDF格式

Computer vision Azure ComputerVision OCR和PDF格式,computer-vision,microsoft-cognitive,azure-cognitive-services,Computer Vision,Microsoft Cognitive,Azure Cognitive Services,我发现了几个关于是否以及如何使用认知服务进行OCR的老问题。在上,我可以找到一个循序渐进的描述,告诉我如何从PDF进行OCR。 当我像页面底部提到的示例一样进行操作时,仍然会得到unsuppertdMediaType结果 { “代码”:“不支持的媒体类型”, “请求ID”:“c427e1c7-3f99-4a74-a36f-1620e68e3b64”, “消息”:“支持的媒体类型:应用程序/八位字节流、多部分/表单数据或应用程序/json”} 当我将PDF更改为图像时,一切正常。 我目前正在跟进

我发现了几个关于是否以及如何使用认知服务进行OCR的老问题。在上,我可以找到一个循序渐进的描述,告诉我如何从PDF进行OCR。 当我像页面底部提到的示例一样进行操作时,仍然会得到unsuppertdMediaType结果

{ “代码”:“不支持的媒体类型”, “请求ID”:“c427e1c7-3f99-4a74-a36f-1620e68e3b64”, “消息”:“支持的媒体类型:应用程序/八位字节流、多部分/表单数据或应用程序/json”}

当我将PDF更改为图像时,一切正常。 我目前正在跟进 但是,尽管请求似乎没有问题,但文档类型仍然不受支持。 我呼吁:

https://.cognitiveservices.azure.com/vision/v2.0/ocr?language=de&detectOrientation=true&Ocp-Apim订阅密钥=&内容类型=应用程序/八位字节流

当然,文件包含在正文中

我没有发布C#或PowerShell,因为问题似乎确实与我从上述URL发出的请求有关


有人可以帮助我了解如何通过Azure ComputerVision从PDF获取文本的有效请求吗?

您收到此错误,因为根据

OCR API适用于满足以下要求的图像:

  • 图像必须以JPEG、PNG、GIF或BMP格式显示
  • 输入图像的大小必须介于50 x 50和4200 x 4200像素之间
  • 图像中的文本可以旋转90度的任意倍数加上高达40度的小角度
也就是说,您可以使用新的ReadAPI,因为它支持PDF格式

Read API可处理满足以下要求的图像:

  • 图像必须以JPEG、PNG、BMP、PDF或TIFF格式显示
  • 图像的尺寸必须介于50 x 50和10000 x 10000像素之间。PDF页面必须为17 x 17英寸或更小
  • 映像的文件大小必须小于20 MB
如果您遵循要求并使用正确的端点,它将保证工作