Google cloud platform Cloud Vision PDF不支持的输入文件格式

Google cloud platform Cloud Vision PDF不支持的输入文件格式,google-cloud-platform,google-cloud-vision,Google Cloud Platform,Google Cloud Vision,我使用cloud vision检测pdf文件中的文本。我使用了文档中提供的代码,但它抛出了一个错误,称为不支持的输入文件格式。我使用100%确定文件是pdf,我甚至使用了示例资源文件我该怎么办 编辑 这是从我使用的文档中提取的代码 const vision = require('@google-cloud/vision').v1; const client = new vision.ImageAnnotatorClient(); const gcsSourceUri = `gs://${b

我使用cloud vision检测pdf文件中的文本。我使用了文档中提供的代码,但它抛出了一个错误,称为不支持的输入文件格式。我使用100%确定文件是pdf,我甚至使用了示例资源文件我该怎么办

编辑

这是从我使用的文档中提取的代码

const vision = require('@google-cloud/vision').v1;

const client = new vision.ImageAnnotatorClient();


const gcsSourceUri = `gs://${bucketName}/${fileName}`;
const gcsDestinationUri = `gs://${bucketName}/${outputPrefix}/`;

const inputConfig = {
  // Supported mime_types are: 'application/pdf' and 'image/tiff'
  mimeType: 'application/pdf',
  gcsSource: {
    uri: gcsSourceUri,
  },
};
const outputConfig = {
  gcsDestination: {
    uri: gcsDestinationUri,
  },
};
const features = [{type: 'DOCUMENT_TEXT_DETECTION'}];
const request = {
  requests: [
    {
      inputConfig: inputConfig,
      features: features,
      outputConfig: outputConfig,
    },
  ],
};

const [operation] = await client.asyncBatchAnnotateFiles(request);
const [filesResponse] = await operation.promise();
const destinationUri =
  filesResponse.responses[0].outputConfig.gcsDestination.uri;
console.log('Json saved to: ' + destinationUri);

我试着将kafka.pdf移到我的gcs bucket中,并运行了python示例代码,正如预期的那样工作。当您将kafka.pdf文件移动到gcs存储桶中时,它可能出了问题


尝试使用他们提供的示例文件“gs://cloud-samples-data/vision/pdf\u-tiff/census2010.pdf”,看看它是否适合您。普查文件对我也很有用。

我尝试将kafka.pdf移到我的gcs存储桶中,并运行了python示例代码,正如预期的那样。当您将kafka.pdf文件移动到gcs存储桶中时,它可能出了问题


尝试使用他们提供的示例文件“gs://cloud-samples-data/vision/pdf\u-tiff/census2010.pdf”,看看它是否适合您。普查文件也适用于我。

对于其他有效的PDF文件,我从batch annotation service获得了相同的响应。在我的例子中,它必须复制/粘贴节点示例中的示例代码,以便将文件上载到google云存储,并包括和的键


看起来你没有包含这些值,但经过一番努力后,我发现如果我上传的PDF没有这些选项,那么注释服务可以容忍它们,这不是一个精确的复制,但我希望它能为您带来进步:)

对于其他有效的PDF文件,我从批注释服务得到了相同的响应。在我的例子中,它必须复制/粘贴节点示例中的示例代码,以便将文件上载到google云存储,并包括和的键


看起来你没有包含这些值,但经过一番努力后,我发现如果我上传的PDF没有这些选项,那么注释服务可以容忍它们,不是准确的复制,但我希望它能为您带来进步:)

您能发布您的代码和问题中的准确错误吗?@Brendan错误:不支持的输入文件格式,这是您在运行此代码时遇到的错误,因此您将kafka.pdf文件从github移动到您的个人gcs存储桶,然后在中对该文件执行文档文本检测你的地面军事系统桶?然后你调用GetOperation查看错误“不支持的输入文件格式”@Brendan无论如何,我最终使用了图像检测,只是将pdf转换为图像。你能发布你的代码和你问题中的确切错误吗?@Brendan错误:不支持的输入文件格式,这是你运行此代码时遇到的错误。因此,你将kafka.pdf文件从github移动到了你的个人gcs存储桶,然后在上面运行文档文本检测你的gcs存储桶里的那个文件?然后你调用GetOperation查看错误“不支持的输入文件格式”@Brendan不管怎样,我最终使用了图像检测,只是将pdf转换为imagegs://cloud-samples-data/vision/pdf_tiff/census2010.pdf 也不适合你吗?gs://cloud samples data/vision/pdf\u tiff/census2010.pdf也不适合你吗?