Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/286.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 从beautifulsoup结果中提取just date_Python_Beautifulsoup - Fatal编程技术网

Python 从beautifulsoup结果中提取just date

Python 从beautifulsoup结果中提取just date,python,beautifulsoup,Python,Beautifulsoup,我正在尝试使用BeautifulSoup从网站上抓取日期: 如何从中仅提取日期时间?我只想:2021年5月21日19:47您可以使用此示例如何从中提取日期时间: 从bs4导入美化组 html_doc=“” 2021年5月21日19:47来源:疯牛病 """ soup=BeautifulSoup(html\u doc,“html.parser”) 对于汤中的ctag。查找所有(“ctag”): dt=ctag.get_text(strip=True).rsplit(maxplit=1)[0] 打

我正在尝试使用BeautifulSoup从网站上抓取日期:


如何从中仅提取日期时间?我只想:2021年5月21日19:47

您可以使用此示例如何从
中提取日期时间:

从bs4导入美化组
html_doc=“”
2021年5月21日19:47来源:疯牛病
"""
soup=BeautifulSoup(html\u doc,“html.parser”)
对于汤中的ctag。查找所有(“ctag”):
dt=ctag.get_text(strip=True).rsplit(maxplit=1)[0]
打印(dt)
印刷品:

2021年5月21日19:47

或:

汤中ctag的
查找所有(“ctag”):
dt=ctag.contents[0].rsplit(maxsplit=1)[0]
打印(dt)

或:

汤中ctag的
查找所有(“ctag”):
dt=ctag.find_next(text=True).rsplit(maxplit=1)[0]
打印(dt)

编辑:要获取文章的dataframe,您可以执行以下操作:

导入请求
从bs4导入BeautifulSoup
作为pd进口熊猫
url=”https://www.moneycontrol.com/company-notices/reliance-industries/notices/RI"
soup=BeautifulSoup(requests.get(url.content,“html.parser”)
数据=[]
对于汤中的ctag。选择(“li ctag”):
data.append(
{
“title”:ctag.find_next(“a”).get_text(strip=True),
“日期”:ctag.find_next(text=True).rsplit(maxsplit=1)[0],
“desc”:ctag.查找下一步(“p”,class=“MT2”).获取文本(strip=True),
}
)
df=pd.DataFrame(数据)
打印(df)
印刷品:

标题日期描述
0信实工业-合规条例。39 (3) ...  2021年5月21日19:47根据《证券法》第39(3)条。。。
1信实工业-根据法规发布的公告。。。2021年5月19日21:20我们参考了SEBI(禁止。。。
信实工业-根据2021年5月17日第17:18号法规发布的公告,继续我们20年5月15日的信函。。。
3 Reliance Industries-根据法规发布的公告…2021年5月17日16:06请参阅附件中Reliance发布的媒体公告。。。
4 Reliance Industries-根据法规发布的公告……2021年5月15日15:15本公司已于2021年5月15日在。。。
5信实工业-合规性法规39(3)…2021年5月14日19:44根据《证券法》第39(3)条。。。
6信实工业-金融机构付款通知…2021年5月13日22:57我们参考了我们日期为2021年5月1日的信函。A。。。
7信实工业-根据《条例》发布的公告…2021年5月12日21:20我们希望通知您,该公司参与。。。
8信实工业-合规性法规39(3)…2021年5月12日19:39根据《证券法》第39(3)条。。。
9信实工业-合规条例39(3)…2021年5月11日19:49根据《证券法》第39(3)条。。。

感谢您的回复,我能问一下,如果不首先将bs4.element.ResultSet转换为字符串,是否还有其他方法可以这样做吗?因为我也需要对下一组数据进行迭代。我正在尝试从网站中提取文章日期、标题和内容:用于情绪分析。因此,我需要提取这些内容和ore在数据框中,请帮助。@fe我已经更新了我的答案。谢谢!!你至少节省了数小时的工作时间。非常感谢!@fe在StackOverflow上随时打开新问题,我会尝试查看它。。。