Xpath 如何获取没有HTML标记的文本_Xpath_Beautifulsoup_Ixmldomelement

Xpath 如何获取没有HTML标记的文本

xpath

Xpath 如何获取没有HTML标记的文本,xpath,beautifulsoup,ixmldomelement,Xpath,Beautifulsoup,Ixmldomelement,以下是HTML： CPSC 353-计算机安全简介（3）安全目标、安全系统、访问控制、网络和安全、完整性、加密基础知识、身份验证。攻击：软件、网络、网站；政府和行业的管理考虑、安全标准；需求、体系结构、设计、实施、测试、操作、维护、获取和服务中的安全问题。先决条件：或及，在CPSC、CPEN或CPEI中声明为主要/次要尝试使用以下代码获得所需的输出： div = soup.select("div.ajaxcourseindentfix")[0] " ".join([word

以下是HTML：


CPSC 353-计算机安全简介（3）
安全目标、安全系统、访问控制、网络和安全、完整性、加密基础知识、身份验证。攻击：软件、网络、网站；政府和行业的管理考虑、安全标准；需求、体系结构、设计、实施、测试、操作、维护、获取和服务中的安全问题。



先决条件：
或
及
，在CPSC、CPEN或CPEI中声明为主要/次要

尝试使用以下代码获得所需的输出：

div = soup.select("div.ajaxcourseindentfix")[0]
" ".join([word for word in div.stripped_strings]).split("Prerequisite: ")[-1]

输出是

'CPSC 253U or CPSC 254 and CPSC 351 , declared major/minor in CPSC, CPEN, or CPEI'

试试这一个，这样你想要的输出就是CPSC、CPEN或CPEI中声明的主要/次要的

“或”，“和”，“

，对吗？我想要的输出是：CPSC 253U或CPSC 254和CPSC 351，CPSC、CPEN或CPEI中声明的主要/次要。只是以文本的形式。我试过了，但下面是我在div.text中得到的：“[Add to Portfolio][Print Course]”？这不是我建议的。你试过我的密码了吗？是的。我是这样尝试的：

course\u preview\u page=requests.get（course\u preview\u URL）soup=BeautifulSoup（course\u preview\u page.content，'lxml'）div=soup.select（“div.ajaxcourseindentfix”）[0]”。join（[div.stripped\u strings中逐字逐句]）.split（“先决条件：”）[-1]

哦，是的。有两个

div

节点具有相同的类名。尝试

div=soup。选择（“div.ajaxcourseindentfix”）[1]

Yup。知道了。非常感谢，安德森。