Apache spark 如何在spark中读取pdf文件
通过使用Spark,我想读取PDF文件,该文件包含表格格式的数据,结果应为结构化数据格式(将其存储在数据库中) 可以建议任何框架读取pdf文件,结果应在结构数据中 PDF格式如下所示 预期结果应为表格格式可能重复的请检查并关闭问题。可能重复的请检查并关闭问题。Apache spark 如何在spark中读取pdf文件,apache-spark,pdf,hadoop2,Apache Spark,Pdf,Hadoop2,通过使用Spark,我想读取PDF文件,该文件包含表格格式的数据,结果应为结构化数据格式(将其存储在数据库中) 可以建议任何框架读取pdf文件,结果应在结构数据中 PDF格式如下所示 预期结果应为表格格式可能重复的请检查并关闭问题。可能重复的请检查并关闭问题。