如何在Powershell中从PDF文件中的特定单元格获取文本
所以我有一个程序,可以在word中打开PDF,从特定单元格中获取文本,然后将其导出到excel表格中如何在Powershell中从PDF文件中的特定单元格获取文本,powershell,Powershell,所以我有一个程序,可以在word中打开PDF,从特定单元格中获取文本,然后将其导出到excel表格中 Set-StrictMode -Version latest $file = "C:\PathToPDF.pdf" $output = "C:\PathToCSV.csv" $application = New-Object -comobject word.application $application.visible = $False $results = @{} Functio
Set-StrictMode -Version latest
$file = "C:\PathToPDF.pdf"
$output = "C:\PathToCSV.csv"
$application = New-Object -comobject word.application
$application.visible = $False
$results = @{}
Function GetWordTable
{
$document = $application.documents.open($file,$false,$true)
$objTable = $document.Tables.Item(1)
$properties = @{
Data = $objTable.Cell(5, 5).Range.Text
}
$results = New-Object -TypeName PsCustomObject -Property $properties
$results | Export-Csv $output -NoTypeInformation
$document.close()
$application.quit()
}
GetWordTable
我一直在填充属性的行中遇到错误,尽管我在一个函数中成功地测试了它,该函数在word文件中查找字符串匹配项并导出到excel
我应该尝试什么?我刚刚意识到我使用的PDF,我认为它是一个连续的表,但从技术上讲,它里面有几个不同的表。因此,只要选择了有效的单元格,代码实际上就可以工作