Python美化组包括空行
我正在用python3和BeautifullSoup创建一个网站,并将其导出到csv。我遇到的问题是一些元素是空白的,当我打印页面时,这些元素现在丢失了。我宁愿它仍然打印,即使它是空白的。因此,在我的csv文件中,当元素为空时,行与列不匹配。我相信,如果我能得到预期的打印工作,我可以修复我的csv文件中的问题 示例html代码Python美化组包括空行,python,beautifulsoup,Python,Beautifulsoup,我正在用python3和BeautifullSoup创建一个网站,并将其导出到csv。我遇到的问题是一些元素是空白的,当我打印页面时,这些元素现在丢失了。我宁愿它仍然打印,即使它是空白的。因此,在我的csv文件中,当元素为空时,行与列不匹配。我相信,如果我能得到预期的打印工作,我可以修复我的csv文件中的问题 示例html代码 <tr><td>item1</td><td>server11</td><td>env</td
<tr><td>item1</td><td>server11</td><td>env</td><td>uptime</td></tr>
<tr><td>item2</td><td></td><td>env</td><td>uptime</td></tr>
输出是
item1,server11,env,uptime
item2,env,uptime
然而,我希望输出像这样
item1,server11,env,uptime
item2,,env,uptime
item1,server11,env,uptime
item2,,env,uptime
您可以使用
str.join
连接所有
中的文本
例如:
from bs4 import BeautifulSoup
txt = '''
<tr><td>item1</td><td>server11</td><td>env</td><td>uptime</td></tr>
<tr><td>item2</td><td></td><td>env</td><td>uptime</td></tr>'''
soup = BeautifulSoup(txt, 'html.parser')
for tr in soup.select('tr'):
print(','.join(td.get_text(strip=True) for td in tr.select('td')))
item1,server11,env,uptime
item2,,env,uptime