Python 之前的文本<；span>；旗帜_Python_Web Scraping_Beautifulsoup

Python 之前的文本<；span>；旗帜

python web-scraping

Python 之前的文本<；span>；旗帜,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,这是我的第一次BS编码实验。我正在抓取的网站是我遇到的问题是这段代码： <div class="cmg_team_name"> ARST <span>101</span> </div> 我的问题是如何仅访问span标志之前的文本。在本例中，我只需要ARST。我尝试了打印大学[0]。获取文本（），打印大学[0]。字符串产生无和数组表示法。我知道我将如何在C++中完成它，但是我假设Python

这是我的第一次BS编码实验。
我正在抓取的网站是
我遇到的问题是这段代码：

<div class="cmg_team_name">
            ARST
            <span>101</span>
</div>

我的问题是如何仅访问span标志之前的文本。在本例中，我只需要

ARST

。

我尝试了打印大学[0]。获取文本（），

打印大学[0]。字符串

产生

无和数组表示法。我知道我将如何在C++中完成它，但是我假设Python／Boobe将在一行中做这件事……谢谢！p> 您必须首先从div中删除span，然后清除额外的字符，如空格和回车符
for university in universities:
    span = [span.extract() for span in university('span')]
    univ = university.text.replace(' ','').replace('\r','').replace('\n','')
    print univ

您必须首先从div中删除span，然后清除额外的字符，如空格和回车符
for university in universities:
    span = [span.extract() for span in university('span')]
    univ = university.text.replace(' ','').replace('\r','').replace('\n','')
    print univ

这就消除了跨度，谢谢。出于某种原因，replace
语句没有删除空格。我将用C++来查看ASCII值，看看发生了什么。我在我的系统中测试了代码。它工作得很好。你能给我看看你在使用replace语句后得到的输出吗？我在problem语句中添加了一些示例输出。奇怪的是.strip（）在清除空白方面也不起作用，这是因为您正在将university.text写入输出。我会更新我的代码给你一个更好的主意。非常感谢。我认为replace（）
函数是就地替换而不是返回值。即使在阅读文档时，我也只是假设情况就是这样。我需要阅读BeautifulSoup的底层数据结构。这消除了跨度，谢谢。出于某种原因，replace
语句没有删除空格。我将用C++来查看ASCII值，看看发生了什么。我在我的系统中测试了代码。它工作得很好。你能给我看看你在使用replace语句后得到的输出吗？我在problem语句中添加了一些示例输出。奇怪的是.strip（）在清除空白方面也不起作用，这是因为您正在将university.text写入输出。我会更新我的代码给你一个更好的主意。非常感谢。我认为replace（）
函数是就地替换而不是返回值。即使在阅读文档时，我也只是假设情况就是这样。我需要阅读BeautifulSoup的基础数据结构。请不要更新代码以包含解决方案，因为它会使答案无效。请不要更新代码以包含解决方案，因为它会使答案无效。