如何在python中刮取web特殊单词

如何在python中刮取web特殊单词,python,web-scraping,Python,Web Scraping,我想要一个网页,删除一些特殊的单词,如果“org”是“England”,请给我id='name'和'England' 我的代码是: from bs4 import BeautifulSoup import requests r = requests.get('https://however.org/plus') soup = BeautifulSoup(r.text, 'html.parser') res = soup.find_all(id={'name', 'org'}) for ite

我想要一个网页,删除一些特殊的单词,如果“org”是“England”,请给我id='name'和'England' 我的代码是:

from bs4 import BeautifulSoup
import requests

r = requests.get('https://however.org/plus')
soup = BeautifulSoup(r.text, 'html.parser')
res = soup.find_all(id={'name', 'org'})

for item in res:
    print(item.text.strip())
因此,我的输出将是:

General English: Intermediate <====== (name)
american   <======= (org)
General English: Elementary
England    <=======
General English: Intermediate Plus
England
General English: Beginner
american
TOEFL iBT: Listening and Speaking
England
TOEFL iBT: Reading
american
Grammar for IELTS
american

我怎样才能解决这个问题?如果org是'England',我想要一个带有org的打印名。

如果您所担心的只是输出,那么对for循环的修改就足够了:

for item in res:
   if 'england' in item.text.lower():
   #if 'england' == item.get('org').lower():
       print(item.get('name'), item.get('org'))
       #print('Name: ', item.get('name'), ', Org:', item.get('org'))

我会使用他们打印输出只是英格兰和不打印的名称我想要打印的名称和下面的他们或抱歉,没有得到它在第一,编辑了相应的答案。检查注释的“如果”是否适用于您。您还可以将这些字符串添加到数据结构中,以便在脚本中进一步使用它们。#print('Name:'item.get('Name'),',Org:',item.get('Org'))函数的第一个和第二个参数之间缺少逗号,现在是正确的。无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无无
for item in res:
   if 'england' in item.text.lower():
   #if 'england' == item.get('org').lower():
       print(item.get('name'), item.get('org'))
       #print('Name: ', item.get('name'), ', Org:', item.get('org'))