Python 如何仅返回HTML代码段中的文本？_Python_Html_Beautifulsoup

Python 如何仅返回HTML代码段中的文本？

python html

Python 如何仅返回HTML代码段中的文本？,python,html,beautifulsoup,Python,Html,Beautifulsoup,我有一个HTML代码段，如下所示： <pre>zdfsfsf adfadfadf adfadfasdfadfad adfadf adf Mill Valley, CA 94941 122-2323-24124 Email: adfadfadf sfsfsfsf</pre> cells = row.find_all('td') for c in cells:

我有一个HTML代码段，如下所示：

<pre>zdfsfsf<br/>adfadfadf
adfadfasdfadfad  adfadf adf 
Mill Valley, CA 94941
122-2323-24124
Email: adfadfadf<br/><i>sfsfsfsf</i></pre>
<br/>

cells = row.find_all('td')
for c in cells:
    c.STRIP_HTML_TAGS()?????? <--WHAT IS THIS FUNCTION?

>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup("""<pre>zdfsfsf<br/>adfadfadf
... adfadfasdfadfad  adfadf adf 
... Mill Valley, CA 94941
... 122-2323-24124
... Email: adfadfadf<br/><i>sfsfsfsf</i></pre>
... <br/>""")
>>> print(soup.get_text())
zdfsfsfadfadfadf
adfadfasdfadfad  adfadf adf 
Mill Valley, CA 94941
122-2323-24124
Email: adfadfadfsfsfsfsf
>>>

我在找这样的东西：

<pre>zdfsfsf<br/>adfadfadf
adfadfasdfadfad  adfadf adf 
Mill Valley, CA 94941
122-2323-24124
Email: adfadfadf<br/><i>sfsfsfsf</i></pre>
<br/>

cells = row.find_all('td')
for c in cells:
    c.STRIP_HTML_TAGS()?????? <--WHAT IS THIS FUNCTION?

>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup("""<pre>zdfsfsf<br/>adfadfadf
... adfadfasdfadfad  adfadf adf 
... Mill Valley, CA 94941
... 122-2323-24124
... Email: adfadfadf<br/><i>sfsfsfsf</i></pre>
... <br/>""")
>>> print(soup.get_text())
zdfsfsfadfadfadf
adfadfasdfadfad  adfadf adf 
Mill Valley, CA 94941
122-2323-24124
Email: adfadfadfsfsfsfsf
>>>

cells=row.find_all（'td'））
对于单元中的c：
c、 带HTML标签（） 您正在寻找：
>>来自bs4导入组
>>>汤=美丽的汤
…adfadfasdfadfad adfadfaf adf
…加利福尼亚州米尔谷，邮编941
... 122-2323-24124
…电子邮件：adfadfaf
sfsfsf
…
“”）
>>>打印（soup.get_text（））
ZDFSFFADF
adfadfasdfadfad adfadfaf adf
加利福尼亚州米尔谷，邮编941
122-2323-24124
电邮：adfadfsfsf
>>>