Python BeautifulSoup：类似于Pandas中的.head（）函数_Python_Beautifulsoup

Python BeautifulSoup：类似于Pandas中的.head（）函数

python

Python BeautifulSoup：类似于Pandas中的.head（）函数,python,beautifulsoup,Python,Beautifulsoup,我有以下BeautifulSoup对象： from bs4 import BeautifulSoup import requests import re url = 'https://www.adviserinfo.sec.gov/IAPD/content/viewform/adv/Sections/iapd_AdvPrivateFundReportingSection.aspx?ORG_PK=161227&FLNG_PK=05C43A1A0008018C026407B10062D49

我有以下BeautifulSoup对象：

from bs4 import BeautifulSoup
import requests
import re

url = 'https://www.adviserinfo.sec.gov/IAPD/content/viewform/adv/Sections/iapd_AdvPrivateFundReportingSection.aspx?ORG_PK=161227&FLNG_PK=05C43A1A0008018C026407B10062D49D056C8CC0'
html = requests.get(url)
soup = BeautifulSoup(html.text, "lxml")

我要找的是Pandas中的.head（）函数。我想在帧的顶部看到一些东西，但对象太长，我无法滚动到顶部

我已经找遍了，但还没有找到任何东西。非常感谢您的帮助。

此问题并非特定于

BeautifulSoup

，而是将字符串截断为@c的问题ᴏʟᴅsᴘᴇᴇᴅ 说：

numlines = 20
print('\n'.join(soup.prettify().splitlines()[:numlines]))

根据需要调整

numlines

。您也可以使用

html.text

，因为我们没有以任何方式处理文档的结构。

这个问题不是特定于

BeautifulSoup

，而是将字符串截断为@c的问题ᴏʟᴅsᴘᴇᴇᴅ 说：

numlines = 20
print('\n'.join(soup.prettify().splitlines()[:numlines]))

根据需要调整

numlines

。您也可以使用

html.text

，因为我们没有以任何方式处理文档的结构。

什么的前几行？这是一个很好的想法，但与熊猫不同，这不是平面数据，而是层次数据。您可以执行类似于

soup.prettify（）.splitlines（）[：20]

您想要什么类型的输出？你可以简单地截断html，但你不需要

beautifulsou

（它也不是有效的html）。我要寻找的是与你在上面的代码之后键入“soup”并输入时得到的输出相同的输出，但只显示顶部而不是底部。试试

l=soup.prettify（）.splitlines（）；打印（'\n'.join（l[：20]+['…']+'l[-20:]）

让我知道这是否有效。什么的前几行？这是一个不错的想法，但与熊猫不同，这不是平面数据，而是层次数据。您可以执行类似于

soup.prettify（）.splitlines（）[：20]

您想要什么类型的输出？你可以简单地截断html，但你不需要

beautifulsou

（它也不是有效的html）。我要寻找的是与你在上面的代码之后键入“soup”并输入时得到的输出相同的输出，但只显示顶部而不是底部。试试

l=soup.prettify（）.splitlines（）；打印（'\n'.join（l[：20]+['…']+'l[-20:]）

如果有效，请告诉我。