Python 之前的文本<;span>;旗帜

Python 之前的文本<;span>;旗帜,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,这是我的第一次BS编码实验。 我正在抓取的网站是 我遇到的问题是这段代码: <div class="cmg_team_name"> ARST <span>101</span> </div> 我的问题是如何仅访问span标志之前的文本。在本例中,我只需要ARST。 我尝试了打印大学[0]。获取文本(),打印大学[0]。字符串产生无和数组表示法。我知道我将如何在C++中完成它,但是我假设Python

这是我的第一次BS编码实验。
我正在抓取的网站是
我遇到的问题是这段代码:

<div class="cmg_team_name">
            ARST
            <span>101</span>
</div>  
我的问题是如何仅访问span标志之前的文本。在本例中,我只需要
ARST

我尝试了打印大学[0]。获取文本(),
打印大学[0]。字符串
产生
和数组表示法。我知道我将如何在C++中完成它,但是我假设Python/Boobe将在一行中做这件事……谢谢!p> 您必须首先从div中删除span,然后清除额外的字符,如空格和回车符

for university in universities:
    span = [span.extract() for span in university('span')]
    univ = university.text.replace(' ','').replace('\r','').replace('\n','')
    print univ

您必须首先从div中删除span,然后清除额外的字符,如空格和回车符

for university in universities:
    span = [span.extract() for span in university('span')]
    univ = university.text.replace(' ','').replace('\r','').replace('\n','')
    print univ

这就消除了跨度,谢谢。出于某种原因,
replace
语句没有删除空格。我将用C++来查看ASCII值,看看发生了什么。我在我的系统中测试了代码。它工作得很好。你能给我看看你在使用replace语句后得到的输出吗?我在problem语句中添加了一些示例输出。奇怪的是.strip()在清除空白方面也不起作用,这是因为您正在将university.text写入输出。我会更新我的代码给你一个更好的主意。非常感谢。我认为
replace()
函数是就地替换而不是返回值。即使在阅读文档时,我也只是假设情况就是这样。我需要阅读BeautifulSoup的底层数据结构。这消除了跨度,谢谢。出于某种原因,
replace
语句没有删除空格。我将用C++来查看ASCII值,看看发生了什么。我在我的系统中测试了代码。它工作得很好。你能给我看看你在使用replace语句后得到的输出吗?我在problem语句中添加了一些示例输出。奇怪的是.strip()在清除空白方面也不起作用,这是因为您正在将university.text写入输出。我会更新我的代码给你一个更好的主意。非常感谢。我认为
replace()
函数是就地替换而不是返回值。即使在阅读文档时,我也只是假设情况就是这样。我需要阅读BeautifulSoup的基础数据结构。请不要更新代码以包含解决方案,因为它会使答案无效。请不要更新代码以包含解决方案,因为它会使答案无效。