Python BeautifulSoup:类似于Pandas中的.head()函数

Python BeautifulSoup:类似于Pandas中的.head()函数,python,beautifulsoup,Python,Beautifulsoup,我有以下BeautifulSoup对象: from bs4 import BeautifulSoup import requests import re url = 'https://www.adviserinfo.sec.gov/IAPD/content/viewform/adv/Sections/iapd_AdvPrivateFundReportingSection.aspx?ORG_PK=161227&FLNG_PK=05C43A1A0008018C026407B10062D49

我有以下BeautifulSoup对象:

from bs4 import BeautifulSoup
import requests
import re

url = 'https://www.adviserinfo.sec.gov/IAPD/content/viewform/adv/Sections/iapd_AdvPrivateFundReportingSection.aspx?ORG_PK=161227&FLNG_PK=05C43A1A0008018C026407B10062D49D056C8CC0'
html = requests.get(url)
soup = BeautifulSoup(html.text, "lxml")
我要找的是Pandas中的.head()函数。我想在帧的顶部看到一些东西,但对象太长,我无法滚动到顶部


我已经找遍了,但还没有找到任何东西。非常感谢您的帮助。

此问题并非特定于
BeautifulSoup
,而是将字符串截断为@c的问题ᴏʟᴅsᴘᴇᴇᴅ 说:

numlines = 20
print('\n'.join(soup.prettify().splitlines()[:numlines]))

根据需要调整
numlines
。您也可以使用
html.text
,因为我们没有以任何方式处理文档的结构。

这个问题不是特定于
BeautifulSoup
,而是将字符串截断为@c的问题ᴏʟᴅsᴘᴇᴇᴅ 说:

numlines = 20
print('\n'.join(soup.prettify().splitlines()[:numlines]))

根据需要调整
numlines
。您也可以使用
html.text
,因为我们没有以任何方式处理文档的结构。

什么的前几行?这是一个很好的想法,但与熊猫不同,这不是平面数据,而是层次数据。您可以执行类似于
soup.prettify().splitlines()[:20]
您想要什么类型的输出?你可以简单地截断html,但你不需要
beautifulsou
(它也不是有效的html)。我要寻找的是与你在上面的代码之后键入“soup”并输入时得到的输出相同的输出,但只显示顶部而不是底部。试试
l=soup.prettify().splitlines();打印('\n'.join(l[:20]+['…']+'l[-20:])
让我知道这是否有效。什么的前几行?这是一个不错的想法,但与熊猫不同,这不是平面数据,而是层次数据。您可以执行类似于
soup.prettify().splitlines()[:20]
您想要什么类型的输出?你可以简单地截断html,但你不需要
beautifulsou
(它也不是有效的html)。我要寻找的是与你在上面的代码之后键入“soup”并输入时得到的输出相同的输出,但只显示顶部而不是底部。试试
l=soup.prettify().splitlines();打印('\n'.join(l[:20]+['…']+'l[-20:])
如果有效,请告诉我。