Python 我们如何使用dask数据帧来读取word和pdf文档?

Python 我们如何使用dask数据帧来读取word和pdf文档?,python,pandas,dataframe,Python,Pandas,Dataframe,有没有一种方法可以使用daskdataframe来读取word和pdf文档 我正在尝试读取pandas数据帧中的文件,然后使用方法dark\u df=da.from\u pandas(word,1)将该数据帧转换为暗数据帧 有人能给我建议执行此任务的更好方法吗?您需要将pdf/word非结构化文档矢量化为结构化csv/tsv/excel。你不能直接加载。不是那么简单。

有没有一种方法可以使用
dask
dataframe来读取
word
pdf
文档

我正在尝试读取pandas数据帧中的文件,然后使用方法
dark\u df=da.from\u pandas(word,1)
将该数据帧转换为暗数据帧


有人能给我建议执行此任务的更好方法吗?

您需要将pdf/word非结构化文档矢量化为结构化csv/tsv/excel。你不能直接加载。不是那么简单。