Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/heroku/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何从html文件中解析名称和值_Python_Beautifulsoup_Html Parsing - Fatal编程技术网

Python 如何从html文件中解析名称和值

Python 如何从html文件中解析名称和值,python,beautifulsoup,html-parsing,Python,Beautifulsoup,Html Parsing,这个问题与我的另一个问题有关 我有以下一些html内容 <tr> <td><strong>User key: </strong></td> <td>0200fde8a7f3d1084224962a4e7c54e69ac3f04da6b8</td> </tr> <tr> <td><strong>Institute id: </strong></td&

这个问题与我的另一个问题有关

我有以下一些html内容

<tr>
<td><strong>User key: </strong></td>
<td>0200fde8a7f3d1084224962a4e7c54e69ac3f04da6b8</td>
</tr>
<tr>
<td><strong>Institute id: </strong></td>
<td>
      030780ffa3641183273ad548ae09872f9dcf4b0c4267<br/>000d6f0004c468345445535453454341010910830123<br/>4567890a<br/> </td>
</tr>
<tr>
<td><strong>part id:</strong></td>
<td>00ecd01536ff66296f9d572219d7acac02d59b24c6</td>
</tr>
<tr>
我已经经历并尝试了一些东西,但不知道我到底需要做什么才能得到欲望的输出。我是python编程新手。看到我的尝试了吗

html_doc = """
<tr>
<td><strong>User key: </strong></td>
<td>0200fde8a7f3d1084224962a4e7c54e69ac3f04da6b8</td>
</tr>
<tr>
<td><strong>Institute id: </strong></td>
<td>
      030780ffa3641183273ad548ae09872f9dcf4b0c4267<br/>000d6f0004c468345445535453454341010910830123<br/>4567890a<br/> </td>
</tr>
<tr>
<td><strong>part id:</strong></td>
<td>00ecd01536ff66296f9d572219d7acac02d59b24c6</td>
</tr>
<tr>
"""

from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc, 'html.parser')


for link in soup.find_all('strong'):
        print link
html_doc=”“”
用户密钥:
0200fde8a7f3d1084224962a4e7c54e69ac3f04da6b8
机构id:
0307800FFA364183273AD548AE09872F9DCF4B0C4267
000D6F0004C46834544535453454341010910830123
4567890a
零件id: 00ecd01536ff66296f9d572219d7acac02d59b24c6 """ 从bs4导入BeautifulSoup soup=BeautifulSoup(html_doc,'html.parser') 查找汤中的链接。查找所有('strong'): 打印链接
您可以做一件事,首先查找所有
tr
标记,然后针对每个
tr
标记,查找其中的所有
td
标记,然后打印其文本。范例-

>>> for i in soup.findAll('tr'):
...     for tdi in i.findAll('td'):
...             print tdi.text.strip(),
...     print
...
User key: 0200fde8a7f3d1084224962a4e7c54e69ac3f04da6b8
Institute id: 030780ffa3641183273ad548ae09872f9dcf4b0c4267000d6f0004c4683454455354534543410109108301234567890a
part id: 00ecd01536ff66296f9d572219d7acac02d59b24c6

谢谢你的回复。我得到了输出,但在每一行的末尾仍然有“()”(空格和括号)。你能展示一下你的代码吗,也许它是实际html的一部分?代码如前所述。我刚刚添加了您的解决方案。您能准确显示输出的内容吗?也许可以尝试最新版本,但不使用print中的
()
,因为它很有帮助。如果答案对你有帮助,我想建议你接受答案(点击答案左侧的勾号),这将对社区有帮助。
>>> for i in soup.findAll('tr'):
...     for tdi in i.findAll('td'):
...             print tdi.text.strip(),
...     print
...
User key: 0200fde8a7f3d1084224962a4e7c54e69ac3f04da6b8
Institute id: 030780ffa3641183273ad548ae09872f9dcf4b0c4267000d6f0004c4683454455354534543410109108301234567890a
part id: 00ecd01536ff66296f9d572219d7acac02d59b24c6