将PDF文本转换为大纲？_Pdf_Inkscape

将PDF文本转换为大纲？

pdf

将PDF文本转换为大纲？,pdf,inkscape,Pdf,Inkscape,有人知道如何将PDF文档中的文本矢量化吗？也就是说，我希望每个字母都是一个形状/轮廓，没有任何文本内容。我使用的是Linux系统，最好是开源或非Windows解决方案上下文：我正在尝试编辑一些旧的PDF，我已经没有这些字体了。我想在Inkscape中这样做，但这将用通用字体替换所有字体，而且几乎不可读。我也一直在使用pdf2ps和ps2pdf来回转换，但字体信息仍保留在那里。因此，当我将它加载到Inkscape中时，它仍然看起来很糟糕有什么想法吗？谢谢。我担心要将PDF矢量化，您仍然需要原始

有人知道如何将PDF文档中的文本矢量化吗？也就是说，我希望每个字母都是一个形状/轮廓，没有任何文本内容。我使用的是Linux系统，最好是开源或非Windows解决方案

上下文：我正在尝试编辑一些旧的PDF，我已经没有这些字体了。我想在Inkscape中这样做，但这将用通用字体替换所有字体，而且几乎不可读。我也一直在使用

pdf2ps

和

ps2pdf

来回转换，但字体信息仍保留在那里。因此，当我将它加载到Inkscape中时，它仍然看起来很糟糕

有什么想法吗？谢谢。

我担心要将PDF矢量化，您仍然需要原始字体（或大量工作）

我想到了一些可能性：

使用
```
pdftk
```
转储未压缩的PDF，找出字体名称，然后在FontMonster或字体服务上查找它们
为了保持字距（我猜字距和对齐是导致文本不可读的原因），使用一些字体来与字体紧密匹配
尝试（再次
```
pdftk
```
将PDF转换为可使用
```
sed
```
编辑的PDF。此编辑将破坏PDF，但
```
pdftk
```
将能够将损坏的PDF重新压缩为可用的PDF）

File display/nr-arena-item.cpp第323行（？）：断言项->状态&nr\u arena\u item\u state\BBOX失败

将您的PDF拆分为单独的页面
将PDF页面转换为SVG
编辑你想要的页面
重新组合页面

stapler burst file.pdf

{file_1.pdf，…，file_N.pdf}

1…N

导入数学
导入操作系统
从PyPDF2导入PdfileWriter、PdfileReader
def拆分（文件名）：
打开（文件名）为inputfp时：
inputpdf=PdfFileReader（inputfp）
base，ext=os.path.splitext（os.path.basename（文件名））
#以零作为输出模板的前缀，以便保留顺序
#（第10页，第09页之后）
输出\u模板=“”。连接([
基础
'_',
'%0',
str（math.ceil（math.log10（inputpdf.getNumPages（））），
“d”，
提取
])
对于范围内的页面（inputpdf.getNumPages（））：
outputpdf=PdfielWriter（）
outputpdf.addPage（inputpdf.getPage（第页））
outputname=输出模板%（第+1页）
以open（outputname，'wb'）作为fp：
outputpdf.write（fp）

filename

outputname

导入操作系统
进口开罗
进口波普勒
def转换（inputname，outputname）：
#将输入文件名转换为URI，以便
uri='file://'+os.path.abspath（inputname）
Pdfile=
pdf2svg input.pdf output.svg