Python 使用Amazon Textract时不支持的文档格式,
当我试图解析通过AmazonS3访问的pdf文件时,它给了我一个错误,请求的文档格式不受支持 我正在将Amazon textract与boto3一起使用。当我试图解析通过AmazonS3访问的pdf文件时,它给了我一个错误,请求不支持do 文档格式。我对这一点相当陌生,在textract的文档中提到pdf文件确实是受支持的 这是我正在使用的代码Python 使用Amazon Textract时不支持的文档格式,,python,python-3.x,amazon-textract,Python,Python 3.x,Amazon Textract,当我试图解析通过AmazonS3访问的pdf文件时,它给了我一个错误,请求的文档格式不受支持 我正在将Amazon textract与boto3一起使用。当我试图解析通过AmazonS3访问的pdf文件时,它给了我一个错误,请求不支持do 文档格式。我对这一点相当陌生,在textract的文档中提到pdf文件确实是受支持的 这是我正在使用的代码 import boto3 textractClient = boto3.client('textract',region_name='us-east-1
import boto3
textractClient = boto3.client('textract',region_name='us-east-1')
response = textractClient.detect_document_text(
Document={'S3Object': {'Bucket': 'bucketName', 'Name': 'filename.pdf'}})
blocks = response['Blocks']
这给了我一个错误,请求的文档格式不受支持。detect\u document\u text()是一个只支持PNG或JPG图像的同步API
如果要处理PDF文件,应使用名为start\u document\u text\u detection()的异步API