Php 从PDF中提取数据并保存到mysql数据库

Php 从PDF中提取数据并保存到mysql数据库,php,mysql,apache-tika,Php,Mysql,Apache Tika,有人建议我从PDF文件中抓取数据,并使用PHP或任何其他工具将其保存到MySql数据库 实际上,我正在创建一个脚本,它将读取纯文本内容(使用ApacheTika工具将pdf内容转换为纯文本),并将其保存到数据库中。但这是一个非常漫长的过程,并不准确 因此,请向我推荐任何其他方法来完成此任务。您可以做一件事,如果您想刮取1或2 pdf,您可以使用任何在线工具将pdf转换为html,然后使用simplehtmlDom库,您可以刮取数据。 您可以使用从pdf中提取文本 我希望它能对您有所帮助您能出示一

有人建议我从PDF文件中抓取数据,并使用PHP或任何其他工具将其保存到MySql数据库

实际上,我正在创建一个脚本,它将读取纯文本内容(使用ApacheTika工具将pdf内容转换为纯文本),并将其保存到数据库中。但这是一个非常漫长的过程,并不准确


因此,请向我推荐任何其他方法来完成此任务。

您可以做一件事,如果您想刮取1或2 pdf,您可以使用任何在线工具将pdf转换为html,然后使用simplehtmlDom库,您可以刮取数据。 您可以使用从pdf中提取文本


我希望它能对您有所帮助

您能出示一些代码吗<代码>不准确什么意思?比如,如果我们想从PDF内容中删除某人的“介绍”和“职务”。因此,我们会在内容中找到这些标题,但在“介绍”或“工作描述”的内容中也有可能找到这些标题。这就是为什么我说这不准确。不,伙计,我有数百万的PDF文件。你可以试试PDF文本提取器类