Python 打印特定行(美化组)

Python 打印特定行(美化组),python,beautifulsoup,Python,Beautifulsoup,目前,我的代码正在通过链接解析并打印网站上的所有信息。我只想打印网站上的一行。我该怎么做呢 这是我的密码: from bs4 import BeautifulSoup import urllib.request r = urllib.request.urlopen("Link goes here").read() soup = BeautifulSoup(r, "html.parser") # This is what I want to change. I currently have i

目前,我的代码正在通过链接解析并打印网站上的所有信息。我只想打印网站上的一行。我该怎么做呢

这是我的密码:

from bs4 import BeautifulSoup
import urllib.request

r = urllib.request.urlopen("Link goes here").read()
soup = BeautifulSoup(r, "html.parser")

# This is what I want to change. I currently have it printing everything.
# I just want a specific line from the website

print (soup.prettify())

不要使用pretty print来尝试解析tds,具体选择标记,如果属性是唯一的,则使用该标记;如果类名是唯一的,则仅使用该标记:

td = soup.select_one("td.content")
td = soup.select_one("td[colspan=3]")
如果是第四个td:

td = soup.select_one("td:nth-of-type(4)")
如果它在一个特定的表中,那么选择该表,然后在表中找到td,尝试将html拆分为行并编制索引实际上比使用索引更糟糕

您可以使用td前面的粗体标记中的文本获取特定td,即财政部大楼分类::

选择第n个表和行:

In [25]: print(soup.select_one("table:nth-of-type(8) tr:nth-of-type(5) td[colspan=3]").text)
O6-OFFICE BUILDINGS

不要使用pretty print来尝试解析tds,具体选择标记,如果属性是唯一的,则使用该标记;如果类名是唯一的,则仅使用该标记:

td = soup.select_one("td.content")
td = soup.select_one("td[colspan=3]")
如果是第四个td:

td = soup.select_one("td:nth-of-type(4)")
如果它在一个特定的表中,那么选择该表,然后在表中找到td,尝试将html拆分为行并编制索引实际上比使用索引更糟糕

您可以使用td前面的粗体标记中的文本获取特定td,即财政部大楼分类::

选择第n个表和行:

In [25]: print(soup.select_one("table:nth-of-type(8) tr:nth-of-type(5) td[colspan=3]").text)
O6-OFFICE BUILDINGS

非常感谢。工作得很漂亮!非常感谢。工作得很漂亮!你要什么线路?有比使用修饰更好、更准确的方法,拆分行和索引将随着对htmlI的最小更改而中断。我希望每次都有一行这样说:E9-WAREHOUSE每次“E9-WAREHOUSE”都可能不同,它周围有什么其他标记?你能分享链接或html吗?你想要哪一行?有比使用修饰更好、更准确的方法,拆分行和索引将随着对htmlI的最小更改而中断。我希望每次都有一行这样说:E9-WAREHOUSE每次“E9-WAREHOUSE”都可能不同,它周围有什么其他标记?你能分享链接或html吗?然后我会使用打印(td)吗?因为我给它打了电话,它打印出来的是“无”。这是我当前的代码:发布了错误的代码片段,你能添加实际的链接或html吗?我将更容易向你展示如何正确解析html。这是链接:在这种情况下,我想打印“O6-OfficeBuildings”,我正在乱搞,把它放在td=soup上。选择一个(“td:nth类型(135)”,然后调用print(td.get\u text()),它可以工作,但只有40%的时间。我只是感到困惑。那之后我会使用打印(td)吗?因为我给它打了电话,它打印出来的是“无”。这是我当前的代码:发布了错误的代码片段,你能添加实际的链接或html吗?我将更容易向你展示如何正确解析html。这是链接:在这种情况下,我想打印“O6-OfficeBuildings”,我正在乱搞,把它放在td=soup上。选择一个(“td:nth类型(135)”,然后调用print(td.get\u text()),它可以工作,但只有40%的时间。我只是感到困惑。