如何在Powershell中从PDF文件中的特定单元格获取文本

如何在Powershell中从PDF文件中的特定单元格获取文本,powershell,Powershell,所以我有一个程序,可以在word中打开PDF,从特定单元格中获取文本,然后将其导出到excel表格中 Set-StrictMode -Version latest $file = "C:\PathToPDF.pdf" $output = "C:\PathToCSV.csv" $application = New-Object -comobject word.application $application.visible = $False $results = @{} Functio

所以我有一个程序,可以在word中打开PDF,从特定单元格中获取文本,然后将其导出到excel表格中

Set-StrictMode -Version latest
$file = "C:\PathToPDF.pdf"
$output   = "C:\PathToCSV.csv"
$application = New-Object -comobject word.application
$application.visible = $False

$results = @{}



Function GetWordTable
{
$document = $application.documents.open($file,$false,$true)

$objTable = $document.Tables.Item(1) 


$properties = @{

      Data = $objTable.Cell(5, 5).Range.Text

}
             $results = New-Object -TypeName PsCustomObject -Property $properties
             $results | Export-Csv $output -NoTypeInformation



    $document.close()
    $application.quit()
}

GetWordTable
我一直在填充属性的行中遇到错误,尽管我在一个函数中成功地测试了它,该函数在word文件中查找字符串匹配项并导出到excel


我应该尝试什么?

我刚刚意识到我使用的PDF,我认为它是一个连续的表,但从技术上讲,它里面有几个不同的表。因此,只要选择了有效的单元格,代码实际上就可以工作