Python 使用lxml添加单一引用xml标记

Python 使用lxml添加单一引用xml标记,python,xml,csv,lxml,elementtree,Python,Xml,Csv,Lxml,Elementtree,基于我在这里找到的几个其他示例,我创建了一个脚本,使用lxml.etree和lxml.ebuilder从csv输入创建xml文件。它几乎满足了我的需要——我正在努力解决的一件事是,我还需要在数据顶部包含一个单一的引用标记,该标记将包含一个静态值 以下是我的示例数据: ACTION|INV_ACCT_CLASS|EXT_INV_ID|WAREHOUSE_ID|NAME|CNTRY_CD|PHONE|ADDR_STR1|ADDR_STR2|CITY|ST|ZIP|ADD_KEY_NUM add|2|

基于我在这里找到的几个其他示例,我创建了一个脚本,使用lxml.etree和lxml.ebuilder从csv输入创建xml文件。它几乎满足了我的需要——我正在努力解决的一件事是,我还需要在数据顶部包含一个单一的引用标记,该标记将包含一个静态值

以下是我的示例数据:

ACTION|INV_ACCT_CLASS|EXT_INV_ID|WAREHOUSE_ID|NAME|CNTRY_CD|PHONE|ADDR_STR1|ADDR_STR2|CITY|ST|ZIP|ADD_KEY_NUM
add|2|AAA_00005|1001213|Company 1|US|9995555555|1313 Mockingbird Lane||New York|NY|10001|44433322
add|2|BBB_00008|1004312|Company 2|US|43255511110|Some other address||Stamford|CT|44112|11122233
到目前为止,我的代码是:

import lxml.etree
 from lxml.builder import E 
 import csv

with open("filename.csv") as csvfile:

                    
  results = E.paiInv(*(
              E.invrec(
               E.action(row['ACTION']),
                E.investor(
                E.inv_account_class(row['INV_ACCOUNT_CLASS']),
                E.ext_inv_id(row['EXT_INV_ID']),
                E.warehouse_id(row['WAREHOUSE_ID']),
                E.name(row['NAME']),
                E.cntry_cd(row['CNTRY_CD']),
                E.phone(row['PHONE']),
                E.addr_str1(row['ADDRESS_STR1']),
                E.addr_str2(row['ADDRESS_STR2']),
                E.city(row['CITY']),
                E.st(row['ST']),
                E.zip(row['ZIP']),
                E.add_key_num(row['ADD_KEY_NUM'])
                      )
                ) for row in csv.DictReader(csvfile, delimiter = '|'))
                          )


 lxml.etree.ElementTree(results).write("OutputFile.xml")
以下是我到目前为止的输出:

<paiInv>
    <invrec>
        <action>add</action>
        <investor>
            <inv_account_class>2</inv_account_class>
            <ext_inv_id>AAA_00005</ext_inv_id>
            <warehouse_id>1001213</warehouse_id>
            <name>Company 1</name>
            <cntry_cd>US</cntry_cd>
            <phone>9995555555</phone>
            <addr_str1>1313 Mockingbird Lane</addr_str1>
            <addr_str2></addr_str2>
            <city>New York</city>
            <st>NY</st>
            <zip>10001</zip>
            <add_key_num>44433322</add_key_num>
        </investor>
    </invrec>
    <invrec>
        <action>add</action>
        <investor>
            <inv_account_class>2</inv_account_class>
            <ext_inv_id>BBB_00008</ext_inv_id>
            <warehouse_id>1004312</warehouse_id>
            <name>Company 2</name>
            <cntry_cd>US</cntry_cd>
            <phone>43255511110</phone>
            <addr_str1>Some other address</addr_str1>
            <addr_str2></addr_str2>
            <city>Stamford</city>
            <st>NB</st>
            <zip>44112</zip>
            <add_key_num>11122233</add_key_num>
        </investor>
    </invrec>
</paiInv>

添加
2.
AAA_00005
1001213
第一公司
美国
9995555555
模仿鸟巷1313号
纽约
纽约
10001
44433322
添加
2.
BBB_00008
1004312
公司2
美国
43255511110
其他地址
斯坦福德
铌
44112
11122233
我需要的输出包括一个额外的(单次出现)标记,名为request_id,出现在数据的顶部,如下所示:

<paiInv>
    <request_id>req44</request_id>
    <invrec>
        <action>add</action>
        <investor>
            <inv_account_class>2</inv_account_class>
            <ext_inv_id>AAA_00005</ext_inv_id>
            <warehouse_id>1001213</warehouse_id>
            <name>Company 1</name>
            <cntry_cd>US</cntry_cd>
            <phone>9995555555</phone>
            <addr_str1>1313 Mockingbird Lane</addr_str1>
            <addr_str2></addr_str2>
            <city>New York</city>
            <st>NY</st>
            <zip>10001</zip>
            <add_key_num>44433322</add_key_num>
        </investor>
    </invrec>
    <invrec>
        <action>add</action>
        <investor>
            <inv_account_class>2</inv_account_class>
            <ext_inv_id>BBB_00008</ext_inv_id>
            <warehouse_id>1004312</warehouse_id>
            <name>Company 2</name>
            <cntry_cd>US</cntry_cd>
            <phone>43255511110</phone>
            <addr_str1>Some other address</addr_str1>
            <addr_str2></addr_str2>
            <city>Stamford</city>
            <st>NB</st>
            <zip>44112</zip>
            <add_key_num>11122233</add_key_num>
        </investor>
    </invrec>
</paiInv>

需求44
添加
2.
AAA_00005
1001213
第一公司
美国
9995555555
模仿鸟巷1313号
纽约
纽约
10001
44433322
添加
2.
BBB_00008
1004312
公司2
美国
43255511110
其他地址
斯坦福德
铌
44112
11122233

如有任何建议,将不胜感激。到目前为止,在尝试获取额外标记时,除了语法错误之外,我无法获取任何其他信息。

在保存文件之前,请尝试以下操作:

doc = lxml.etree.ElementTree(results)
ins = lxml.etree.fromstring('<request_id>req44</request_id>')
ins.tail = "\n"
dest = doc.xpath('/paiInv')[0]
dest.insert(0,ins)
print(lxml.etree.tostring(doc).decode())
doc=lxml.etree.ElementTree(结果)
ins=lxml.etree.fromstring('req44')
ins.tail=“\n”
dest=doc.xpath('/painv')[0]
目标插入(0,ins)
打印(lxml.etree.tostring(doc.decode())

输出应该是您想要的。

非常感谢Jack。这确实给了我想要的东西。这对于未来的需要也会很有用。再次感谢。@tsmithmpls很高兴它对你有用!我不知道这是否是正确的方案(在我最初的问题得到回答后再问一个问题),如果有必要,我会很高兴地创建一个新问题。话虽如此,我想知道是否有一种方法,通过上面的解决方案,可以生成没有空标记的xml文件。也就是说,如果csv中的某个特定单元格为空,则不为该特定记录生成关联的标记。到目前为止,我还看不到用上述解决方案实现这一点的方法。我将就此提出一个不同的问题,因为我认为正确的方法是创建xml,然后删除所有出现的空标记。