Python .text和.get_text()之间的差异
在Python .text和.get_text()之间的差异,python,html,beautifulsoup,html-parsing,Python,Html,Beautifulsoup,Html Parsing,在BeautifulSoup中,.text和.get_text()之间有什么区别吗 获取元素的文本应该首选哪一个 >>> from bs4 import BeautifulSoup >>> >>> html = "<div>text1 <span>text2</span><div>" >>> soup = BeautifulSoup(html, "html.parser") &
BeautifulSoup
中,.text
和.get_text()
之间有什么区别吗
获取元素的文本应该首选哪一个
>>> from bs4 import BeautifulSoup
>>>
>>> html = "<div>text1 <span>text2</span><div>"
>>> soup = BeautifulSoup(html, "html.parser")
>>> div = soup.div
>>> div.text
'text1 text2'
>>> div.get_text()
'text1 text2'
>>来自bs4导入组
>>>
>>>html=“text1 text2”
>>>soup=BeautifulSoup(html,“html.parser”)
>>>div=soup.div
>>>div.text
“text1 text2”
>>>分区获取文本()
“text1 text2”
看起来像。因此,不带参数调用get_text
与.text
是一样的。但是,get_text
还可以支持各种关键字参数来更改其行为方式(分隔符
,条带
,类型
)。如果您需要对结果进行更多控制,那么您需要函数形式。基本上您可以使用get_text()
使用自定义分隔符,您应该将其用作。text
是私有属性,甚至没有文档记录。@Selcuk是的,我个人使用的是get_text()
一直以来,主要是因为它有明确的文档记录,但我看到很多bs4用户直接使用.text
,并对其缺点感到好奇。谢谢嗯……那什么是div.string
?