从PDF文件中的数据创建ics文件

从PDF文件中的数据创建ics文件,pdf,icalendar,Pdf,Icalendar,我正在寻找一种将PDF文档转换为多个ics文件的方法,员工可以使用这些文件将他们的两周花名册添加到智能手机日历或桌面上的outlook日历中。创建多个文件所需的信息将从PDF中提取,方法是从每列中搜索选定的首字母,然后引用与首字母相同的行中的数据。它们是一种特殊的顺序吗?我需要数据显示在ics文件中,以便将其导入智能手机日历???您可以搜索pdf API,了解以编程方式处理pdf的更多详细信息 这里有一些在线转换器可以帮助你。他们将pdf转换成word 然而,从PDF中重建结构化数据并非易事

我正在寻找一种将PDF文档转换为多个ics文件的方法,员工可以使用这些文件将他们的两周花名册添加到智能手机日历或桌面上的outlook日历中。创建多个文件所需的信息将从PDF中提取,方法是从每列中搜索选定的首字母,然后引用与首字母相同的行中的数据。它们是一种特殊的顺序吗?我需要数据显示在ics文件中,以便将其导入智能手机日历???

您可以搜索pdf API,了解以编程方式处理pdf的更多详细信息

这里有一些在线转换器可以帮助你。他们将pdf转换成word


然而,从PDF中重建结构化数据并非易事,因为程序必须在布局中扣除语义。因此,大多数程序只能从pdf中恢复分散的数据。

我使用PERL和windows Adobe pdf viewer来突出显示pdf中的所有文本,并将其剪切粘贴到文本文件中。正如前面的回答所说,您必须编写PERL(或任何其他文本处理语言)来选择PDF的格式。然后,您可以使用PERL将其打印到csv或ical或任何您想要的格式。我已经在github.com上共享了我的代码。我不确定您是否了解GIT,但是如果您希望我在GIT之外发送PERL代码,请向我发送一条私人消息

我转换的PDF文件如下:

我的PERL代码的Git hub和我使用的输入文件如下:

很难看,对不起。但它是有效的。我会尽快把它清理干净