Xpath 如何获取没有HTML标记的文本
以下是HTML:Xpath 如何获取没有HTML标记的文本,xpath,beautifulsoup,ixmldomelement,Xpath,Beautifulsoup,Ixmldomelement,以下是HTML: CPSC 353-计算机安全简介(3) 安全目标、安全系统、访问控制、网络和安全、完整性、加密基础知识、身份验证。攻击:软件、网络、网站;政府和行业的管理考虑、安全标准;需求、体系结构、设计、实施、测试、操作、维护、获取和服务中的安全问题。 先决条件: 或 及 ,在CPSC、CPEN或CPEI中声明为主要/次要 尝试使用以下代码获得所需的输出: div = soup.select("div.ajaxcourseindentfix")[0] " ".join([word
CPSC 353-计算机安全简介(3)
安全目标、安全系统、访问控制、网络和安全、完整性、加密基础知识、身份验证。攻击:软件、网络、网站;政府和行业的管理考虑、安全标准;需求、体系结构、设计、实施、测试、操作、维护、获取和服务中的安全问题。
先决条件:
或
及
,在CPSC、CPEN或CPEI中声明为主要/次要
尝试使用以下代码获得所需的输出:
div = soup.select("div.ajaxcourseindentfix")[0]
" ".join([word for word in div.stripped_strings]).split("Prerequisite: ")[-1]
输出是
'CPSC 253U or CPSC 254 and CPSC 351 , declared major/minor in CPSC, CPEN, or CPEI'
试试这一个,这样你想要的输出就是CPSC、CPEN或CPEI中声明的主要/次要的
“或”,“和”,“
,对吗?我想要的输出是:CPSC 253U或CPSC 254和CPSC 351,CPSC、CPEN或CPEI中声明的主要/次要。只是以文本的形式。我试过了,但下面是我在div.text中得到的:“[Add to Portfolio][Print Course]”?这不是我建议的。你试过我的密码了吗?是的。我是这样尝试的:course\u preview\u page=requests.get(course\u preview\u URL)soup=BeautifulSoup(course\u preview\u page.content,'lxml')div=soup.select(“div.ajaxcourseindentfix”)[0]”。join([div.stripped\u strings中逐字逐句]).split(“先决条件:”)[-1]
哦,是的。有两个div
节点具有相同的类名。尝试div=soup。选择(“div.ajaxcourseindentfix”)[1]
Yup。知道了。非常感谢,安德森。