Python 我们如何使用dask数据帧来读取word和pdf文档?
有没有一种方法可以使用Python 我们如何使用dask数据帧来读取word和pdf文档?,python,pandas,dataframe,Python,Pandas,Dataframe,有没有一种方法可以使用daskdataframe来读取word和pdf文档 我正在尝试读取pandas数据帧中的文件,然后使用方法dark\u df=da.from\u pandas(word,1)将该数据帧转换为暗数据帧 有人能给我建议执行此任务的更好方法吗?您需要将pdf/word非结构化文档矢量化为结构化csv/tsv/excel。你不能直接加载。不是那么简单。
dask
dataframe来读取word
和pdf
文档
我正在尝试读取pandas数据帧中的文件,然后使用方法dark\u df=da.from\u pandas(word,1)
将该数据帧转换为暗数据帧
有人能给我建议执行此任务的更好方法吗?您需要将pdf/word非结构化文档矢量化为结构化csv/tsv/excel。你不能直接加载。不是那么简单。