Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/356.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark 如何在spark中读取pdf文件_Apache Spark_Pdf_Hadoop2 - Fatal编程技术网

Apache spark 如何在spark中读取pdf文件

Apache spark 如何在spark中读取pdf文件,apache-spark,pdf,hadoop2,Apache Spark,Pdf,Hadoop2,通过使用Spark,我想读取PDF文件,该文件包含表格格式的数据,结果应为结构化数据格式(将其存储在数据库中) 可以建议任何框架读取pdf文件,结果应在结构数据中 PDF格式如下所示 预期结果应为表格格式可能重复的请检查并关闭问题。可能重复的请检查并关闭问题。

通过使用Spark,我想读取PDF文件,该文件包含表格格式的数据,结果应为结构化数据格式(将其存储在数据库中)

可以建议任何框架读取pdf文件,结果应在结构数据中

PDF格式如下所示

预期结果应为表格格式

可能重复的请检查并关闭问题。可能重复的请检查并关闭问题。