Python 使用Amazon Textract时不支持的文档格式，_Python_Python 3.x_Amazon Textract

Python 使用Amazon Textract时不支持的文档格式，

python python-3.x

Python 使用Amazon Textract时不支持的文档格式，,python,python-3.x,amazon-textract,Python,Python 3.x,Amazon Textract,当我试图解析通过AmazonS3访问的pdf文件时，它给了我一个错误，请求的文档格式不受支持我正在将Amazon textract与boto3一起使用。当我试图解析通过AmazonS3访问的pdf文件时，它给了我一个错误，请求不支持do 文档格式。我对这一点相当陌生，在textract的文档中提到pdf文件确实是受支持的这是我正在使用的代码 import boto3 textractClient = boto3.client('textract',region_name='us-east-1

当我试图解析通过AmazonS3访问的pdf文件时，它给了我一个错误，请求的文档格式不受支持

我正在将Amazon textract与boto3一起使用。当我试图解析通过AmazonS3访问的pdf文件时，它给了我一个错误，请求不支持do 文档格式。我对这一点相当陌生，在textract的文档中提到pdf文件确实是受支持的

这是我正在使用的代码

import boto3
textractClient = boto3.client('textract',region_name='us-east-1')
response = textractClient.detect_document_text(
        Document={'S3Object': {'Bucket': 'bucketName', 'Name': 'filename.pdf'}})
blocks = response['Blocks']

这给了我一个错误，请求的文档格式不受支持。

detect\u document\u text（）是一个只支持PNG或JPG图像的同步API

如果要处理PDF文件，应使用名为start\u document\u text\u detection（）的异步API