Java 将PDF转换为纯文本时的转换API NPE
我正在编写一些代码,使用GAE的转换API对PDF进行验证。目前,我在运行“ConversionResult=service.convert(conv);”时遇到一个空指针错误。我试图复制教程中包含的代码(https://developers.google.com/appengine/docs/java/conversion/overview),但我不得不从BlobStore中获取资产对象。我已经在下面粘贴了代码和堆栈跟踪;你知道哪里不对吗?我试着做一个尝试。。。捕获,但这只会导致方法悄悄失败。此外,我不能使用内置的错误代码方法,因为没有创建ConversionResult对象。我一直在寻找这个问题的解决方案,虽然我发现了一些类似问题的帖子,但我没有找到任何解决方案。此外,每个人似乎都在使用我上面链接的相同示例代码;谷歌真的没有更多关于转换的文档吗 谢谢你的帮助Java 将PDF转换为纯文本时的转换API NPE,java,google-app-engine,Java,Google App Engine,我正在编写一些代码,使用GAE的转换API对PDF进行验证。目前,我在运行“ConversionResult=service.convert(conv);”时遇到一个空指针错误。我试图复制教程中包含的代码(https://developers.google.com/appengine/docs/java/conversion/overview),但我不得不从BlobStore中获取资产对象。我已经在下面粘贴了代码和堆栈跟踪;你知道哪里不对吗?我试着做一个尝试。。。捕获,但这只会导致方法悄悄失败。
public static void parse(String key, BlobKey bkey) throws IOException {
BlobstoreInputStream in = new BlobstoreInputStream(bkey);
byte[] attachmentData = IOUtils.toByteArray(in);
in.read(attachmentData);
System.out.println(attachmentData.toString());
System.out.println(attachmentData.length);
System.out.println("parse(): blob fetched");
//Prep for conversion
Asset fileAsset = new Asset("application/pdf", attachmentData);
System.out.println(fileAsset.getData().toString());
Document pdfDoc = new Document(fileAsset);
ConversionOptions options = ConversionOptions.Builder
.withOcrInputLanguage("en");
Conversion conv = new Conversion(pdfDoc, "text/plain", options);
if (conv.equals(null))
System.out.println("Conversion is null!");
// Actual conversion (takes a while!)
ConversionService service = ConversionServiceFactory.getConversionService();
if (service.equals(null))
System.out.println("Service is null!");
// Fails below!!
// ¯\(°_o)/¯
ConversionResult result = service.convert(conv);
ConversionErrorCode err = result.getErrorCode();
System.out.println(err.toString());
// Check for success, return conversion as String
System.out.println("parse(): 7");
if (result.success()) {
System.out.println("parse(): 8");
// Usually, there will only be 1 asset, but running it through a for loop to be sure
System.out.println("parse(): 9");
for (Asset asset : result.getOutputDoc().getAssets()) {
System.out.println("parse(): 10");
String text = new String(asset.getData());
System.out.println("parse(): 11");
System.out.println(text);
}
}
else { //PDF not converted
System.out.println("Error: PDF not converted");
// Maybe add more error handling
}
}
警告
2012年8月20日下午3:10:55 com.google.apphosting.utils.jetty.JettyLogger警告
警告:/verifyPDF.jsp
java.lang.NullPointerException
位于com.google.appengine.api.conversion.ConversionServicePb$AssetInfo$Builder.setName(ConversionServicePb.java:886)
位于com.google.appengine.api.conversion.AssetProtoConverter.doForward(AssetProtoConverter.java:30)
位于com.google.appengine.api.conversion.AssetProtoConverter.doForward(AssetProtoConverter.java:17)
位于com.google.appengine.repackaged.com.google.common.base.Converter.convert(Converter.java:52)
位于com.google.appengine.api.conversion.DocumentProtoConverter.doForward(DocumentProtoConverter.java:33)
位于com.google.appengine.api.conversion.DocumentProtoConverter.doForward(DocumentProtoConverter.java:18)
位于com.google.appengine.repackaged.com.google.common.base.Converter.convert(Converter.java:52)
位于com.google.appengine.api.conversion.ConversionProtoConverter.doForward(ConversionProtoConverter.java:38)
位于com.google.appengine.api.conversion.ConversionProtoConverter.doForward(ConversionProtoConverter.java:16)
位于com.google.appengine.repackaged.com.google.common.base.Converter.convert(Converter.java:52)
位于com.google.appengine.api.conversion.ConversionRequestProtoConverter.doForward(ConversionRequestProtoConverter.java:40)
位于com.google.appengine.api.conversion.ConversionRequestProtoConverter.doForward(ConversionRequestProtoConverter.java:19)
位于com.google.appengine.repackaged.com.google.common.base.Converter.convert(Converter.java:52)
位于com.google.appengine.api.conversion.ConversionServiceImpl.convertAsync(ConversionServiceImpl.java:94)
位于com.google.appengine.api.conversion.ConversionServiceImpl.convert(ConversionServiceImpl.java:66)
位于com.google.appengine.api.conversion.ConversionServiceImpl.convert(ConversionServiceImpl.java:59)
位于coupflipsite.PDFVerify.parse(PDFVerify.java:73)
位于org.apache.jsp.verifyPDF\u jsp.\u jsp服务(verifyPDF\u jsp.java:65)
位于org.apache.jasper.runtime.HttpJspBase.service(HttpJspBase.java:97)
位于javax.servlet.http.HttpServlet.service(HttpServlet.java:717)
位于org.apache.jasper.servlet.JspServletWrapper.service(JspServletWrapper.java:377)
位于org.apache.jasper.servlet.JspServlet.serviceJspFile(JspServlet.java:313)
位于org.apache.jasper.servlet.JspServlet.service(JspServlet.java:260)
在com.google.appengine.tools.development.PrivilegedJspServlet.access$101(PrivilegedJspServlet.java:23)
在com.google.appengine.tools.development.privilegedjsspservlet$2.run上(privilegedjsspservlet.java:59)
位于java.security.AccessController.doPrivileged(本机方法)
在com.google.appengine.tools.development.PrivilegedJspServlet.service上(PrivilegedJspServlet.java:57)
位于javax.servlet.http.HttpServlet.service(HttpServlet.java:717)
位于org.mortbay.jetty.servlet.ServletHolder.handle(ServletHolder.java:511)
位于org.mortbay.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1166)
位于com.google.appengine.tools.development.headerficationfilter.doFilter(headerficationfilter.java:35)
位于org.mortbay.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1157)
在com.google.appengine.api.blobstore.dev.ServeBlobFilter.doFilter上(ServeBlobFilter.java:60)
位于org.mortbay.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1157)
位于com.google.apphosting.utils.servlet.TransactionCleanupFilter.doFilter(TransactionCleanupFilter.java:43)
位于org.mortbay.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1157)
位于com.google.appengine.tools.development.StaticFileFilter.doFilter(StaticFileFilter.java:125)
位于org.mortbay.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1157)
位于com.google.appengine.tools.development.BackendServersFilter.doFilter(BackendServersFilter.java:97)
位于org.mortbay.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1157)
位于org.mortbay.jetty.servlet.ServletHandler.handle(ServletHandler.java:388)
位于org.mortbay.jetty.security.SecurityHandler.handle(SecurityHandler.java:216)
位于org.mortbay.jetty.servlet.SessionHandler.handle(SessionHandler.java:182)
位于org.mortbay.jetty.handler.ContextHandler.handle(ContextHandler.java:765)
位于org.mortbay.jetty.webapp.WebAppContext.handle(WebAppContext.java:418)
位于com.google.appengine.tools.development.DevAppEngineWebAppContext.handle(DevAppEngineWebAppContext.java:94)
位于org.mortbay.jetty.handler.HandlerWrapper.handle(HandlerWrapper.java:152)
位于com.google.appengine.tools.development.JettyContainerService$ApiProxyHandler.handle(JettyContainerService.java:370)
位于org.mortbay.jetty.handler.HandlerWrapper.handle(HandlerWrapper.java:152)
在org.mortbay.jetty
Asset fileAsset = new Asset("application/pdf", attachmentData, "filename.pdf");