Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Excel 从PDF搜索记录页码的有效方法_Excel_Search_Adobe Reader - Fatal编程技术网

Excel 从PDF搜索记录页码的有效方法

Excel 从PDF搜索记录页码的有效方法,excel,search,adobe-reader,Excel,Search,Adobe Reader,我有一个大约1200个查询(零件号)的列表,这些查询是在100页的PDF中指定的。我需要做的就是在PDF中记录每个查询出现的页面。我想不出一个聪明的方法来做这件事。这应该需要我5-20个小时来做这个搜索搜索,所以如果有人能给我一个好主意之前,5小时标记,这将是伟大的 假设您可以通过编程从纯文本(例如,通过使用正则表达式)确定上下文中的“查询”是什么: 您可以使用pdftk将PDF拆分为不同的文件(每页1个文件) 然后使用pdf-to-text实用程序将这些文件转换为文本,如下所示: 还是这个

我有一个大约1200个查询(零件号)的列表,这些查询是在100页的PDF中指定的。我需要做的就是在PDF中记录每个查询出现的页面。我想不出一个聪明的方法来做这件事。这应该需要我5-20个小时来做这个搜索搜索,所以如果有人能给我一个好主意之前,5小时标记,这将是伟大的

假设您可以通过编程从纯文本(例如,通过使用正则表达式)确定上下文中的“查询”是什么:

您可以使用pdftk将PDF拆分为不同的文件(每页1个文件)

然后使用pdf-to-text实用程序将这些文件转换为文本,如下所示:

还是这个

最后,用你最喜欢的编程语言为自己编写一个简单的脚本,以确定哪些文件包含“查询”(不管它看起来像什么)