Python 将word文档解析为excel文件,每行一个单词
我正在处理大量的word文件,我想制作一个excel文件,其中每个word文件都是一列,每个文档中的每个单词都是一行。我是python新手;我该怎么做 我有这个代码来分隔单词:Python 将word文档解析为excel文件,每行一个单词,python,database,excel,Python,Database,Excel,我正在处理大量的word文件,我想制作一个excel文件,其中每个word文件都是一列,每个文档中的每个单词都是一行。我是python新手;我该怎么做 我有这个代码来分隔单词: import string remove = dict.fromkeys(map(ord, '\n ' + string.punctuation)) with open('data10.txt', 'r') as f: for line in f: for word in line.split():
import string
remove = dict.fromkeys(map(ord, '\n ' + string.punctuation))
with open('data10.txt', 'r') as f:
for line in f:
for word in line.split():
w = f.read().translate(remove)
print(word.lower())
我只需要知道如何使每个单词成为excel中的一行。最简单的方法是从命令行将其传输到csv文件
python myscript.py > words.csv
最简单的方法是从命令行将其通过管道传输到csv文件
python myscript.py > words.csv
当我这样做的时候,我得到了一个错误:回溯(最后一次调用):文件“Parse”,第7行,w=f.read()。翻译(删除)TypeError:需要一个字符缓冲区对象尝试将“r”改为“rb”dunno先生看一看,如果这对google的“TypeError:需要一个字符缓冲区”没有帮助,看看我这样做的时候你是否能把它处理完,我得到错误:Traceback(最近一次调用最后一次):文件“Parse”,第7行,w=f.read()。翻译(删除)类型错误:需要字符缓冲区对象尝试将“r”更改为“rb”dunno man看一看,如果这没有帮助google搜索“TypeError:需要字符缓冲区”,看看你是否能解决它