Python 使用Amazon Textract时不支持的文档格式,

Python 使用Amazon Textract时不支持的文档格式,,python,python-3.x,amazon-textract,Python,Python 3.x,Amazon Textract,当我试图解析通过AmazonS3访问的pdf文件时,它给了我一个错误,请求的文档格式不受支持 我正在将Amazon textract与boto3一起使用。当我试图解析通过AmazonS3访问的pdf文件时,它给了我一个错误,请求不支持do 文档格式。我对这一点相当陌生,在textract的文档中提到pdf文件确实是受支持的 这是我正在使用的代码 import boto3 textractClient = boto3.client('textract',region_name='us-east-1

当我试图解析通过AmazonS3访问的pdf文件时,它给了我一个错误,请求的文档格式不受支持

我正在将Amazon textract与boto3一起使用。当我试图解析通过AmazonS3访问的pdf文件时,它给了我一个错误,请求不支持do 文档格式。我对这一点相当陌生,在textract的文档中提到pdf文件确实是受支持的

这是我正在使用的代码

import boto3
textractClient = boto3.client('textract',region_name='us-east-1')
response = textractClient.detect_document_text(
        Document={'S3Object': {'Bucket': 'bucketName', 'Name': 'filename.pdf'}})
blocks = response['Blocks']

这给了我一个错误,请求的文档格式不受支持。

detect\u document\u text()是一个只支持PNG或JPG图像的同步API

如果要处理PDF文件,应使用名为start\u document\u text\u detection()的异步API