Python 使用lxml添加单一引用xml标记
基于我在这里找到的几个其他示例,我创建了一个脚本,使用lxml.etree和lxml.ebuilder从csv输入创建xml文件。它几乎满足了我的需要——我正在努力解决的一件事是,我还需要在数据顶部包含一个单一的引用标记,该标记将包含一个静态值 以下是我的示例数据:Python 使用lxml添加单一引用xml标记,python,xml,csv,lxml,elementtree,Python,Xml,Csv,Lxml,Elementtree,基于我在这里找到的几个其他示例,我创建了一个脚本,使用lxml.etree和lxml.ebuilder从csv输入创建xml文件。它几乎满足了我的需要——我正在努力解决的一件事是,我还需要在数据顶部包含一个单一的引用标记,该标记将包含一个静态值 以下是我的示例数据: ACTION|INV_ACCT_CLASS|EXT_INV_ID|WAREHOUSE_ID|NAME|CNTRY_CD|PHONE|ADDR_STR1|ADDR_STR2|CITY|ST|ZIP|ADD_KEY_NUM add|2|
ACTION|INV_ACCT_CLASS|EXT_INV_ID|WAREHOUSE_ID|NAME|CNTRY_CD|PHONE|ADDR_STR1|ADDR_STR2|CITY|ST|ZIP|ADD_KEY_NUM
add|2|AAA_00005|1001213|Company 1|US|9995555555|1313 Mockingbird Lane||New York|NY|10001|44433322
add|2|BBB_00008|1004312|Company 2|US|43255511110|Some other address||Stamford|CT|44112|11122233
到目前为止,我的代码是:
import lxml.etree
from lxml.builder import E
import csv
with open("filename.csv") as csvfile:
results = E.paiInv(*(
E.invrec(
E.action(row['ACTION']),
E.investor(
E.inv_account_class(row['INV_ACCOUNT_CLASS']),
E.ext_inv_id(row['EXT_INV_ID']),
E.warehouse_id(row['WAREHOUSE_ID']),
E.name(row['NAME']),
E.cntry_cd(row['CNTRY_CD']),
E.phone(row['PHONE']),
E.addr_str1(row['ADDRESS_STR1']),
E.addr_str2(row['ADDRESS_STR2']),
E.city(row['CITY']),
E.st(row['ST']),
E.zip(row['ZIP']),
E.add_key_num(row['ADD_KEY_NUM'])
)
) for row in csv.DictReader(csvfile, delimiter = '|'))
)
lxml.etree.ElementTree(results).write("OutputFile.xml")
以下是我到目前为止的输出:
<paiInv>
<invrec>
<action>add</action>
<investor>
<inv_account_class>2</inv_account_class>
<ext_inv_id>AAA_00005</ext_inv_id>
<warehouse_id>1001213</warehouse_id>
<name>Company 1</name>
<cntry_cd>US</cntry_cd>
<phone>9995555555</phone>
<addr_str1>1313 Mockingbird Lane</addr_str1>
<addr_str2></addr_str2>
<city>New York</city>
<st>NY</st>
<zip>10001</zip>
<add_key_num>44433322</add_key_num>
</investor>
</invrec>
<invrec>
<action>add</action>
<investor>
<inv_account_class>2</inv_account_class>
<ext_inv_id>BBB_00008</ext_inv_id>
<warehouse_id>1004312</warehouse_id>
<name>Company 2</name>
<cntry_cd>US</cntry_cd>
<phone>43255511110</phone>
<addr_str1>Some other address</addr_str1>
<addr_str2></addr_str2>
<city>Stamford</city>
<st>NB</st>
<zip>44112</zip>
<add_key_num>11122233</add_key_num>
</investor>
</invrec>
</paiInv>
添加
2.
AAA_00005
1001213
第一公司
美国
9995555555
模仿鸟巷1313号
纽约
纽约
10001
44433322
添加
2.
BBB_00008
1004312
公司2
美国
43255511110
其他地址
斯坦福德
铌
44112
11122233
我需要的输出包括一个额外的(单次出现)标记,名为request_id,出现在数据的顶部,如下所示:
<paiInv>
<request_id>req44</request_id>
<invrec>
<action>add</action>
<investor>
<inv_account_class>2</inv_account_class>
<ext_inv_id>AAA_00005</ext_inv_id>
<warehouse_id>1001213</warehouse_id>
<name>Company 1</name>
<cntry_cd>US</cntry_cd>
<phone>9995555555</phone>
<addr_str1>1313 Mockingbird Lane</addr_str1>
<addr_str2></addr_str2>
<city>New York</city>
<st>NY</st>
<zip>10001</zip>
<add_key_num>44433322</add_key_num>
</investor>
</invrec>
<invrec>
<action>add</action>
<investor>
<inv_account_class>2</inv_account_class>
<ext_inv_id>BBB_00008</ext_inv_id>
<warehouse_id>1004312</warehouse_id>
<name>Company 2</name>
<cntry_cd>US</cntry_cd>
<phone>43255511110</phone>
<addr_str1>Some other address</addr_str1>
<addr_str2></addr_str2>
<city>Stamford</city>
<st>NB</st>
<zip>44112</zip>
<add_key_num>11122233</add_key_num>
</investor>
</invrec>
</paiInv>
需求44
添加
2.
AAA_00005
1001213
第一公司
美国
9995555555
模仿鸟巷1313号
纽约
纽约
10001
44433322
添加
2.
BBB_00008
1004312
公司2
美国
43255511110
其他地址
斯坦福德
铌
44112
11122233
如有任何建议,将不胜感激。到目前为止,在尝试获取额外标记时,除了语法错误之外,我无法获取任何其他信息。在保存文件之前,请尝试以下操作:
doc = lxml.etree.ElementTree(results)
ins = lxml.etree.fromstring('<request_id>req44</request_id>')
ins.tail = "\n"
dest = doc.xpath('/paiInv')[0]
dest.insert(0,ins)
print(lxml.etree.tostring(doc).decode())
doc=lxml.etree.ElementTree(结果)
ins=lxml.etree.fromstring('req44')
ins.tail=“\n”
dest=doc.xpath('/painv')[0]
目标插入(0,ins)
打印(lxml.etree.tostring(doc.decode())
输出应该是您想要的。非常感谢Jack。这确实给了我想要的东西。这对于未来的需要也会很有用。再次感谢。@tsmithmpls很高兴它对你有用!我不知道这是否是正确的方案(在我最初的问题得到回答后再问一个问题),如果有必要,我会很高兴地创建一个新问题。话虽如此,我想知道是否有一种方法,通过上面的解决方案,可以生成没有空标记的xml文件。也就是说,如果csv中的某个特定单元格为空,则不为该特定记录生成关联的标记。到目前为止,我还看不到用上述解决方案实现这一点的方法。我将就此提出一个不同的问题,因为我认为正确的方法是创建xml,然后删除所有出现的空标记。