通过URL从PHP中的PDF文档中提取标题

通过URL从PHP中的PDF文档中提取标题,php,pdf,extract,Php,Pdf,Extract,我需要从(直接)url中提取pdf文档的标题,因此我将收到如下url:,并且我只需要提取此pdf文档的标题,而无需下载整个文档 我看到Zend Framework具有与此功能类似的功能: $pdf = Zend_Pdf::load($pdfFilePath); $title=$pdf->properties['Title']; 但是,如何在普通PHP中实现这一点,以及如何仅使用url实现这一点(不需要下载整个文档)?谢谢。您在找basename()吗 将返回: something.pdf

我需要从(直接)url中提取pdf文档的标题,因此我将收到如下url:,并且我只需要提取此pdf文档的标题,而无需下载整个文档

我看到Zend Framework具有与此功能类似的功能:

$pdf = Zend_Pdf::load($pdfFilePath);
$title=$pdf->properties['Title'];

但是,如何在普通PHP中实现这一点,以及如何仅使用url实现这一点(不需要下载整个文档)?谢谢。

您在找basename()吗

将返回:

something.pdf

您正在查找basename()

将返回:

something.pdf

假设您需要提取文档本身中的标题(而不是PDF文件的名称),那么很遗憾,您需要一个插件来处理这个问题——这在常规PHP中无法实现(很容易)。但是,有很多插件可供选择,您的使用可能会使一个插件比另一个插件更适用:

  • 阿帕切福普酒店
  • dompdf
  • FPDF
  • html2ps
  • 强积金
  • PDFlib
  • TCPDF
  • wkhtmltopdf
  • Zend_Pdf
至于实际的标题提取,你正在使用这种方法;加载整个PDF后(很遗憾,您必须这样做),您需要以下内容:

$title=$pdf->properties['Title'];

希望这有帮助

假设您需要提取文档本身的标题(而不是PDF文件的名称),不幸的是,您需要一个插件来处理这个问题——这在普通PHP中无法实现(很容易)。但是,有很多插件可供选择,您的使用可能会使一个插件比另一个插件更适用:

  • 阿帕切福普酒店
  • dompdf
  • FPDF
  • html2ps
  • 强积金
  • PDFlib
  • TCPDF
  • wkhtmltopdf
  • Zend_Pdf
至于实际的标题提取,你正在使用这种方法;加载整个PDF后(很遗憾,您必须这样做),您需要以下内容:

$title=$pdf->properties['Title'];

希望这有帮助

不,不完全是这样,basename将仅从url提取名称,这是最后的解决方案,但我想提取实际pdf的title属性,例如:,在这里,basename将仅返回“thebook”,但文档的标题是“AnIntroductionMachineLearning-thebook”…在这种情况下,答案是否定的-您需要下载文档并使用库来提取标题。不,不完全是这样,basename将仅从url提取名称,这是最后的解决方案,但我希望提取实际pdf的标题属性,例如:,这里,basename将仅返回“thebook”,但是文档的标题是“介绍机器学习-书籍”…在这种情况下,答案是否定的-您需要下载文档并使用库提取标题。