Python 将XML标记写入CSV,而不管是否存在另一个使用过的标记
我有一个包含单词和单词定义的XML文件。一些单词通过定义连接到一个基词(例如,“ahh”是一个基词,“ahhed”是一个没有定义标记的屈折变化) 下面是我正在解析的XML的pastebin示例: 我目前的代码如下:Python 将XML标记写入CSV,而不管是否存在另一个使用过的标记,python,xml,csv,Python,Xml,Csv,我有一个包含单词和单词定义的XML文件。一些单词通过定义连接到一个基词(例如,“ahh”是一个基词,“ahhed”是一个没有定义标记的屈折变化) 下面是我正在解析的XML的pastebin示例: 我目前的代码如下: from xml.dom.minidom import parse import csv def writeToCSV(myWords): csvfile = open(r'xmlfile', 'w', encoding='utf-8') fieldnames =
from xml.dom.minidom import parse
import csv
def writeToCSV(myWords):
csvfile = open(r'xmlfile', 'w', encoding='utf-8')
fieldnames = ['hw', 'def']
writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
writer.writeheader()
entries = myWords.getElementsByTagName("superentry")
for entry in entries:
try:
word = entry.getElementsByTagName("hw")[0].childNodes[0].data
except AttributeError:
print(entry, entry.firstChild)
for definition in entry.getElementsByTagName("def"):
try:
defValue = definition.childNodes[0].data
except AttributeError:
print(definition, definition.firstChild)
writer.writerow({'hw': word, 'def': defValue})
doc = parse(r'outputfile')
myWords = doc.getElementsByTagName("dps-data")[0]
# Get get each word entry
books = myWords.getElementsByTagName("superentry")
# Print each word
writeToCSV(myWords)
这个脚本允许我从XML文件中取出
(单词)和
(定义),但它不会打印出没有定义的
标记,只是跳过它们
即使
标记不存在,是否有方法打印标记的数据
我还想弄清楚如何在那些没有定义的屈折词上打印出“基本”词(标签aah
)