Python 打印特定行（美化组）_Python_Beautifulsoup

Python 打印特定行（美化组）

python

Python 打印特定行（美化组）,python,beautifulsoup,Python,Beautifulsoup,目前，我的代码正在通过链接解析并打印网站上的所有信息。我只想打印网站上的一行。我该怎么做呢这是我的密码： from bs4 import BeautifulSoup import urllib.request r = urllib.request.urlopen("Link goes here").read() soup = BeautifulSoup(r, "html.parser") # This is what I want to change. I currently have i

目前，我的代码正在通过链接解析并打印网站上的所有信息。我只想打印网站上的一行。我该怎么做呢

这是我的密码：

from bs4 import BeautifulSoup
import urllib.request

r = urllib.request.urlopen("Link goes here").read()
soup = BeautifulSoup(r, "html.parser")

# This is what I want to change. I currently have it printing everything.
# I just want a specific line from the website

print (soup.prettify())

不要使用pretty print来尝试解析tds，具体选择标记，如果属性是唯一的，则使用该标记；如果类名是唯一的，则仅使用该标记：

td = soup.select_one("td.content")
td = soup.select_one("td[colspan=3]")

如果是第四个td：

td = soup.select_one("td:nth-of-type(4)")

如果它在一个特定的表中，那么选择该表，然后在表中找到td，尝试将html拆分为行并编制索引实际上比使用索引更糟糕

您可以使用td前面的粗体标记中的文本获取特定td，即财政部大楼分类：：

选择第n个表和行：

In [25]: print(soup.select_one("table:nth-of-type(8) tr:nth-of-type(5) td[colspan=3]").text)
O6-OFFICE BUILDINGS

不要使用pretty print来尝试解析tds，具体选择标记，如果属性是唯一的，则使用该标记；如果类名是唯一的，则仅使用该标记：

td = soup.select_one("td.content")
td = soup.select_one("td[colspan=3]")

如果是第四个td：

td = soup.select_one("td:nth-of-type(4)")

如果它在一个特定的表中，那么选择该表，然后在表中找到td，尝试将html拆分为行并编制索引实际上比使用索引更糟糕

您可以使用td前面的粗体标记中的文本获取特定td，即财政部大楼分类：：

选择第n个表和行：

In [25]: print(soup.select_one("table:nth-of-type(8) tr:nth-of-type(5) td[colspan=3]").text)
O6-OFFICE BUILDINGS

非常感谢。工作得很漂亮！非常感谢。工作得很漂亮！你要什么线路？有比使用修饰更好、更准确的方法，拆分行和索引将随着对htmlI的最小更改而中断。我希望每次都有一行这样说：E9-WAREHOUSE每次“E9-WAREHOUSE”都可能不同，它周围有什么其他标记？你能分享链接或html吗？你想要哪一行？有比使用修饰更好、更准确的方法，拆分行和索引将随着对htmlI的最小更改而中断。我希望每次都有一行这样说：E9-WAREHOUSE每次“E9-WAREHOUSE”都可能不同，它周围有什么其他标记？你能分享链接或html吗？然后我会使用打印（td）吗？因为我给它打了电话，它打印出来的是“无”。这是我当前的代码：发布了错误的代码片段，你能添加实际的链接或html吗？我将更容易向你展示如何正确解析html。这是链接：在这种情况下，我想打印“O6-OfficeBuildings”，我正在乱搞，把它放在td=soup上。选择一个（“td:nth类型（135）”，然后调用print（td.get\u text（）），它可以工作，但只有40%的时间。我只是感到困惑。那之后我会使用打印（td）吗？因为我给它打了电话，它打印出来的是“无”。这是我当前的代码：发布了错误的代码片段，你能添加实际的链接或html吗？我将更容易向你展示如何正确解析html。这是链接：在这种情况下，我想打印“O6-OfficeBuildings”，我正在乱搞，把它放在td=soup上。选择一个（“td:nth类型（135）”，然后调用print（td.get\u text（）），它可以工作，但只有40%的时间。我只是感到困惑。