Python “靓汤”的输出为;正在搜索您的内容…”;当尝试获取主要文章文本时
我正在尝试使用BeautifulSoup从newswire网站的一些页面中提取主要文章文本。而不是文本输出。我得到一个输出,上面写着“搜索你的内容…” 我将非常感谢任何帮助。我似乎在做一些根本错误的事情。(我很抱歉,如果我是一名编码初学者,所以我做得不对) 尝试CSS选择器Python “靓汤”的输出为;正在搜索您的内容…”;当尝试获取主要文章文本时,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我正在尝试使用BeautifulSoup从newswire网站的一些页面中提取主要文章文本。而不是文本输出。我得到一个输出,上面写着“搜索你的内容…” 我将非常感谢任何帮助。我似乎在做一些根本错误的事情。(我很抱歉,如果我是一名编码初学者,所以我做得不对) 尝试CSS选择器“.release body”: 从文本包装导入包装 从bs4导入BeautifulSoup 从urllib.request导入请求,urlopen 地点=”https://www.newswire.ca/news-relea
“.release body”
:
从文本包装导入包装
从bs4导入BeautifulSoup
从urllib.request导入请求,urlopen
地点=”https://www.newswire.ca/news-releases/rbc-capital-markets-launches-aiden-r-a-new-ai-powered-electronic-trading-platform-891623791.html"
hdr={“用户代理”:“Mozilla/5.0”}
req=请求(站点,标题=hdr)
页面=urlopen(请求)
soup=BeautifulSoup(第页,“html.parser”)
text=soup。选择一个(“.release body”)。获取文本(strip=True,separator=”“)
打印(“\n”.join(换行(文本,宽度=80)))
印刷品:
RBC和Borealis人工智能的交易员和人工智能科学家合作提供了一个真正的解决方案-
世界人工智能解决方案,有助于提高交易结果和客户的洞察力
可测量和可解释的方式纽约,2020年10月14日/CNW/-RBC资本
市场部今天宣布推出Aiden®,这是一种基于人工智能的电子交易工具
在its中使用深度强化学习计算能力的平台
为客户追求更好的交易结果和洞察力。艾登®
该平台由RBC资本市场公司和世界银行Borealis AI共同开发-
由RBC创建的一流人工智能研究中心,交易员和人工智能科学家共同工作
并排创造最初大胆的概念,并提供真实世界
解决方案在这样做的过程中,这两个组织都承担了最大的责任之一
当今人工智能领域的挑战——将深度强化学习应用于
一个不断变化的环境,如股票交易,具有可测量的
用户可解释的结果。“Aiden®体现了我们的长期承诺
利用下一代人工智能技术为客户创造差异化的解决方案
我们的客户,”全球股票联席主管Bobby Grubert说, 加拿大皇家银行资本市场,
说。“Aiden®是RBC之间大规模合作的结果
等等
数据是在html的
p
标记from::before中动态生成的,所以请尝试selenium或从xhr中查找endpoint(如果您知道的话)!非常感谢@Andrej。这很有魅力!!!与使用selenium(这是我最后的希望)相比,这种方法速度更快、效率更高。非常感谢您的帮助!!!
from bs4 import BeautifulSoup
from urllib.request import Request, urlopen
site= "https://www.newswire.ca/news-releases/rbc-capital-markets-launches-aiden-r-a-new-ai-powered-electronic-trading-platform-891623791.html"
hdr = {'User-Agent': 'Mozilla/5.0'}
req = Request(site,headers=hdr)
page = urlopen(req)
soup = BeautifulSoup(page)
text = soup.find_all('p', {"class":"text-muted"})[0].text.strip()
print(text)