Azure Computer Vision 2.0 PDF到文本不起作用

Azure Computer Vision 2.0 PDF到文本不起作用,azure,pdf,computer-vision,azure-cognitive-services,Azure,Pdf,Computer Vision,Azure Cognitive Services,我正在尝试使用计算机视觉2.0解析PDF文件中的文本。我正在关注,并已将MediaTypeHeaderValue更改为“application/pdf”。我得到一个错误,内容类型不受支持。我将其更改为“multipart/form data”,并在处理过程中出错。如何使用计算机视觉处理PDF文件?查看表单识别器服务,从PDF中提取数据。 凯文, 您正在使用不支持PDF输入的旧版“OCR”API。请使用最新的OCR技术处理PDF文档。3.0版自5月份开始正式上市。Read支持长达2000页的大型图

我正在尝试使用计算机视觉2.0解析PDF文件中的文本。我正在关注,并已将MediaTypeHeaderValue更改为“application/pdf”。我得到一个错误,内容类型不受支持。我将其更改为“multipart/form data”,并在处理过程中出错。如何使用计算机视觉处理PDF文件?

查看表单识别器服务,从PDF中提取数据。 凯文, 您正在使用不支持PDF输入的旧版“OCR”API。请使用最新的OCR技术处理PDF文档。3.0版自5月份开始正式上市。Read支持长达2000页的大型图像、多页和混合语言文档。 请看地图


请注意,如果您不仅希望从表单中提取文本,还希望从表单中提取布局细节(如表、复选框和键值对)、使用预构建模型以及构建自定义模型来处理文档,则表单识别器非常有用。它现在是GA。

请您添加更多有关更改为“多部分/表单数据”时出现的错误的详细信息。计算机视觉2.0 OCR的输入要求:支持的图像格式:JPEG、PNG、GIF、BMP。图像文件大小必须小于4MB。图像尺寸必须介于50 x 50和4200 x 4200像素之间,并且图像不能大于1000万像素。可以在图像中提取(OCR)文本并在文档(pdf、docx)中翻译文本的Azure服务是Azure认知搜索。docs.microsoft.com/en-us/azure/search/…带有图像和文本组合的PDF。PDF中的文本可以在索引过程中提取,无需使用丰富步骤,但添加图像和自然语言处理通常会产生比标准索引提供的更好的结果。多部分/表单数据的错误消息为:
Response:{“code”:“BadArgument”,“requestId”:“08a0d362-ad3c-49c4-8dd6-5c13d3029563”,“消息”:“处理Http请求时出错”}
感谢Ram msft推荐Azure认知搜索。是否有地方对这两项服务进行比较。似乎这两项服务都应该做同样的事情,而且是由同一家公司生产的。我想其中一项将逐渐消失,取而代之的是另一项。这看起来确实是一个有趣的产品,我计划使用它。现在它在pPublic预览版及其折扣率相当高。我想一旦它进入GA,它将是一个天文数字。谢谢你,Sanjeev。你对版本的看法是正确的。显然,我在遵循文档时在某处感到困惑,没有注意到转换。