Python BeautifulSoup:类似于Pandas中的.head()函数
我有以下BeautifulSoup对象:Python BeautifulSoup:类似于Pandas中的.head()函数,python,beautifulsoup,Python,Beautifulsoup,我有以下BeautifulSoup对象: from bs4 import BeautifulSoup import requests import re url = 'https://www.adviserinfo.sec.gov/IAPD/content/viewform/adv/Sections/iapd_AdvPrivateFundReportingSection.aspx?ORG_PK=161227&FLNG_PK=05C43A1A0008018C026407B10062D49
from bs4 import BeautifulSoup
import requests
import re
url = 'https://www.adviserinfo.sec.gov/IAPD/content/viewform/adv/Sections/iapd_AdvPrivateFundReportingSection.aspx?ORG_PK=161227&FLNG_PK=05C43A1A0008018C026407B10062D49D056C8CC0'
html = requests.get(url)
soup = BeautifulSoup(html.text, "lxml")
我要找的是Pandas中的.head()函数。我想在帧的顶部看到一些东西,但对象太长,我无法滚动到顶部
我已经找遍了,但还没有找到任何东西。非常感谢您的帮助。此问题并非特定于
BeautifulSoup
,而是将字符串截断为@c的问题ᴏʟᴅsᴘᴇᴇᴅ 说:
numlines = 20
print('\n'.join(soup.prettify().splitlines()[:numlines]))
根据需要调整
numlines
。您也可以使用html.text
,因为我们没有以任何方式处理文档的结构。这个问题不是特定于BeautifulSoup
,而是将字符串截断为@c的问题ᴏʟᴅsᴘᴇᴇᴅ 说:
numlines = 20
print('\n'.join(soup.prettify().splitlines()[:numlines]))
根据需要调整
numlines
。您也可以使用html.text
,因为我们没有以任何方式处理文档的结构。什么的前几行?这是一个很好的想法,但与熊猫不同,这不是平面数据,而是层次数据。您可以执行类似于soup.prettify().splitlines()[:20]
您想要什么类型的输出?你可以简单地截断html,但你不需要beautifulsou
(它也不是有效的html)。我要寻找的是与你在上面的代码之后键入“soup”并输入时得到的输出相同的输出,但只显示顶部而不是底部。试试l=soup.prettify().splitlines();打印('\n'.join(l[:20]+['…']+'l[-20:])
让我知道这是否有效。什么的前几行?这是一个不错的想法,但与熊猫不同,这不是平面数据,而是层次数据。您可以执行类似于soup.prettify().splitlines()[:20]
您想要什么类型的输出?你可以简单地截断html,但你不需要beautifulsou
(它也不是有效的html)。我要寻找的是与你在上面的代码之后键入“soup”并输入时得到的输出相同的输出,但只显示顶部而不是底部。试试l=soup.prettify().splitlines();打印('\n'.join(l[:20]+['…']+'l[-20:])
如果有效,请告诉我。