Python 3.x 我已将PDF转换为文本,我现在正尝试删除不需要的文本,然后重新合并以创建csv
我从州选举委员会收集选举结果。他们没有通过csv提供的数据,所以我有一个PDF。我可以使用open with将PDF转换为文本,我将行拆分,因为间距已关闭。我的下一步是删除我不想要的文本。我只想要ED#,候选人和他们获得的票数,这样我就可以转换为csv进行计算。仅供参考,此PDF有490页长。到目前为止您尝试了什么?请使用PDFP python库。它们具有表到数据帧的转换功能。然后可以将数据帧保存到csvPython 3.x 我已将PDF转换为文本,我现在正尝试删除不需要的文本,然后重新合并以创建csv,python-3.x,csv,text,Python 3.x,Csv,Text,我从州选举委员会收集选举结果。他们没有通过csv提供的数据,所以我有一个PDF。我可以使用open with将PDF转换为文本,我将行拆分,因为间距已关闭。我的下一步是删除我不想要的文本。我只想要ED#,候选人和他们获得的票数,这样我就可以转换为csv进行计算。仅供参考,此PDF有490页长。到目前为止您尝试了什么?请使用PDFP python库。它们具有表到数据帧的转换功能。然后可以将数据帧保存到csv